Analyseweb.fr  
Le forum de la communauté francophone
des web analytics

Septembre 08, 2010, 02:02:25 *
Bienvenue, Invité. Veuillez vous connecter ou vous inscrire.

Connexion avec identifiant, mot de passe et durée de la session
Nouvelles: Bienvenue sur ce forum! Pensez à vous présenter!
Accueil Aide Rechercher Identifiez-vous Inscrivez-vous
Pages: [1]
Imprimer
Auteur Fil de discussion: Installation d'un SDC server pour les novices...  (Lu 3015 fois)
benji
Néophyte
*
Hors ligne Hors ligne

Messages: 6


Voir le profil
« le: Mai 28, 2008, 12:11:09 »


Bonjour

Nous avions auparavant un webtrends 7 sans SDC server.

Nous installons actuellement un SDC server avec un webtrends 8.

Nous tentons actuellement de faire fonctionner un SDC server (monté sur Apache) sur notre site, pour collecter les tags de differents sites (intranet et internet).
Nous avons installé un premier profil, internet, et ensuite quelques semaines plus tard, le second, intranet.

Nous avons réalisé un test sur un site internet et un site intranet, en créant 2 datasources et 2 profils differents, avec Id differents. Nous avons utilisé alors les scripts js générés lors de la creation des datasources.

Les scripts java tournent correctement, et alimentent (a priori) le serveur SDC.

Le probleme que nous avons est que l'on a l'impression que chaque profil va analyser et inclure dans ses rapports les données des deux datasources, meme si un seul est coché dans le profil.
Dans le tableau de bord du site internet, on voit par exemple clairement dans les tableaux pages, site référent et pages de sortie, des pages qui correspondent au site intranet, chose impossible, car les deux sites n'ont rien a voir entre eux, et ces données n'apparaissaient pas dans les rapports du profil internet avant que l'on ait mis en place le profil intranet.

Je suis vraiment novice dans le domaine, et ce n'est pas evident de trouver à qui parler.

Mes questions seraient donc :

- Est il normal qu'un datasource à Id unique récupère des données d'un autre datasource ?
- Le script généré lors de la création d'un datasouce SDC doit il etre inclus en entier dans l'index du site, ou doit il etre configuré, épuré, ou autre ?
- Comment analyser l'information qui arrive sur le SDC server, pour savoir si les données sont correctes ?

Je peux communiquer si besoin le script utilisé.

Questions subsidiaires :

- Est il nécessaire de déclarer les Id des datasources sur le serveur SDC ?
- Si on utilise des cookies, sont ils obligatoirement récupéré par le SDC server, ou y a t il un autre moyen ?
- Ou peut on trouver sur le site le Wtid.js ?

Merci encore si quelqu'un a certaines réponses.

A bientot



Journalisée
Guillaume
Néophyte
*
Hors ligne Hors ligne

Messages: 16


Voir le profil
« Répondre #1 le: Mai 28, 2008, 04:16:45 »

Bonjour,

L'ID SDC mentionné dans la datasource Webtrends sert uniquement à générer le script qui doit être inséré dans les pages. Il n'est donc pas utilisé par Webtrends lors de l'analyse pour distinguer les hits dans les fichiers logs.
Le serveur SDC est configurable à l'aide des fichiers "dcs.cfg" et "webtrendssites.lst" et qui se trouve dans un dossier "cfg" situé dans le dossier d'installation de SDC (par défaut: C:\Program Files\Webtrends\SmartSource Data Collector\)

Il y a plusieurs choses à modifier dans ces fichiers.
Dans "dcs.cfg": trouver la ligne qui donne une valeur à "splitlog". Cette ligne est en commentaire par défaut (ligne commencant par "#"). Il faut supprimer le commentaire et mettre la valeur à true. Donc: "splitlogs=true". Ceci a pour effet d'envoyer les hits dans des fichiers logs différents si l'ID est différent, le nom des fichiers logs commençant par l'ID.
Dans le fichier "webtrendssites.lst", il faut ajouter une ligne pour chaque ID SDC que l'on désire "tracker" à l'aide du serveur. (en incrémentant la valeur de la colonne "datasourceid" à chaque ligne!)

Après avoir redémarré le service web (Apache dans ce cas-ci) pour appliquer les changements, les fichiers logs devraient être générés avec l'ID dans le nom du fichier.
Il faut donc modifier le chemin d'accès au fichiers logs dans la datasource Webtrends pour inclure uniquement les fichiers avec le bon ID.
Exemple: "D:\SDCLogs\dcsb0cd25bp4ii1w0yiy6ckqj_8p1y*.log". On s'assure de cette façon que la datasource pointe sur les données uniquement du site voulu.

Pour la deuxième question, le script est censé être inclus en entier, mais il est toujours possible de le modifier en fonction des besoins évidemment. Mais il doit être inclus dans toutes les pages, pas seulement l'index!

Comment analyser l'information qui arrive sur le SDC server? Avec Webtrends bien entendu!  Clin d'oeil
Plus sérieusement, en ouvrant les fichiers logs, il est possible de voir si les informations collectées semblent correct ou non. Les rapports Webtrends sont évidemment une bonne indication de ce qui est collecté aussi!

Concernant les questions subsidiaires:
- Il est nécessaire de configurer les ID dans le fichier webtrendssites.lst, du moins si on utilise la configuration par défaut. Il par contre possible de désactiver cette option dans le fichier dcs.cfg en modifiant la valeur du paramètre "servicemodel".
- le tag SDC génère toujours un cookie, mais on peut choisir la façon dont Webtrends identifie les visiteurs en choisissant une autre méthode de "Session Tracking" au niveau du profil
- le fichier wtid.js n'existe pas tel quel sur le serveur. Il est généré dynamiquement par le serveur SDC en fonction des cookies notemment.

Voilà, j'espère avoir aidé!  Sourire

Guillaume.
Journalisée
benji
Néophyte
*
Hors ligne Hors ligne

Messages: 6


Voir le profil
« Répondre #2 le: Mai 28, 2008, 07:14:41 »

Bonjour Guillaume

Merci beaucoup pour ces infos

Je vais vérifier tout cela demain et te tiens au courant du résultat


Bonne soirée

Benjamin
Journalisée
benji
Néophyte
*
Hors ligne Hors ligne

Messages: 6


Voir le profil
« Répondre #3 le: Juin 06, 2008, 05:07:30 »

Rebonjour à tous

Apres avoir suivi les infos de guillaume, j'ai donc modifié le splitlog à true, et rajouté les Id de mes datasources dans le webtrendssites.lst

Mais rien n'y fait.
Les logs continuent d'arriver sous la forme d'un seul et unique fichier de type :

dcs-2008-06-06-13-00000-dlxwtrendsd0.log

Dans cette log, on retrouve pourtant les logs des deux sites analysés, dont une ligne d'exemple suit (j'y ai mis des xx pour des raisons de confidentialité):

2008-06-06 13:00:13 158.156.156.221 - intranet.xx.fr GET /contenu.htm WT.tz=2&WT.bh=15&WT.ul=fr&WT.cd=32&WT.sr=1280x1024&WT.jo=Yes&WT.js=Yes&WT.jv=1.3&WT.ct=unknown&WT.fi=Yes&WT.fv=9.0&WT.tv=1.0.7&WT.es=intranet.xx.fr/contenu.htm&WT.vt_f_tlh=1212757221&WT.vt_tlh=1212747378&WT.vt_tlv=1212747378&WT.co=Yes&WT.vt_s=1&WT.vt_a_s=1&WT.vt_sid=158.xx.xx.221-1211553266.967308.1212757221027&WT.co_f=158.xx.xx.221-1211553266.967308 200 - - Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+1.1.4322) WEBTRENDS_ID=158.xx.xx.221-1211553266.967308;+WT_ACCT=158.xx.xx.221-1211553266.967308 http://intranet.xx.fr/ dcs5w0txb10000wocrvqy1nqm_6n1p

2008-06-06 13:00:28 158.156.156.221 - www.test.fr GET /acces.php WT.tz=2&WT.bh=15&WT.ul=fr&WT.cd=32&WT.sr=1024x768&WT.jo=Yes&WT.ti=CDC%20Confiance%20Electronique%20Europ\xc3\xa9enne&WT.js=Yes&WT.jv=1.3&WT.ct=unknown&WT.fi=Yes&WT.fv=9.0&WT.tv=1.0.7&WT.es=www.test.fr/acces.php&WT.vt_f_tlh=1212756762&WT.vt_tlh=1212756754&WT.co=Yes&WT.vt_sid=158.xx.xx.221-1212756754.317847.1212756762266&WT.co_f=158.xx.xx.221-1212756754.317847 200 - - Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322) WEBTRENDS_ID=158.xx.xx.221-1212756754.317847;+WT_ACCT=158.xx.xx.221-1212756754.317847 http://www.test.fr/ dcsjgvzjd10000082v30sdu8z_2e6j

Donc les logs arrivent bien de chacun des sites, mais se retrouve dans un seul et meme fichier, et sont analysés globalement par chacun des profils, sans tenir compte des dcsId.

Plusieurs questions se posent :
- Le split log fonctionne t il avec un serveur Apache ? Il semblerait que certaines doc webtrends indiquent que cette option ne fonctionne que sous IIS.
- En installant un script qui eclatera automatiquement les logs, est ce que le probleme pet etre contourné ?
- Pourrait il etre possible que certaines options sous apache n'aient pas été demarée, et bloque le fonctionnement du splitlog ?

Question subsidiaire :
Dans le webtrendssites.lst, le TimeZone est à -3. Or, nous avons un decalage entre les logs, et leurs enregistrements :
root      root      637549 jun  6 11:59 dcs-2008-06-06-09-00000-wtrendsd0.log
Faut il mettre le TimeZone à +1 ?

Merci d'avance pour vos reponses. Et tres bonne soirée à vous

Benjamin
Journalisée
Julien Coquet
Responsable Web Analytics Association France
Administrateur
Confirmé
*****
Hors ligne Hors ligne

Messages: 938


Responsable WAA France


Voir le profil WWW
« Répondre #4 le: Juin 06, 2008, 06:40:33 »

Split log Apache avec grep:

grep "www.test.fr" access.log >> test.fr.access
grep "www.intranet.fr" access.log >> intranet.fr.access

et hop Sourire
Journalisée

Responsable Web Analytics Association - France
Directeur Web Analytics, Consultant Senior - Hub'Sales
AnalyseWeb.fr | Blog
JacquesWarren
Débutant
**
Hors ligne Hors ligne

Messages: 54


Consultant indépendant - Web Analytique


Voir le profil WWW
« Répondre #5 le: Juin 07, 2008, 04:24:45 »

Benjamin,

J'ai fait au moins une vingtaine d'installation SDC, mais jamais sur Apache; il faudrait voir avec le support technique ses particularités.

Dans le webtrendssite.lst, t'es-tu assuré que la deuxième valeur était à 2 (ou enfin selon l'ordre de création)?

Regarde aussi dans le dcs.cfg la valeur de "service mode"; est-ce à true or false. Essaie en changeant la valeur qui s'y trouve.

Enfin, comme tu sais, tout changement à dcs.cfg et webtrendssite.lst demande de redémarrer le serveur (IISRESET dans DOS. Pour Apache, j'sais pas).
Journalisée

benji
Néophyte
*
Hors ligne Hors ligne

Messages: 6


Voir le profil
« Répondre #6 le: Juin 10, 2008, 03:34:48 »


Bonjour

Merci pour les infos

On a fait un split de log avec des GREP, et les logs sont bien eclatées.
On leur donne un nom particulier, et on les mets dans des dossiers propre à chaque datasource.

Webtrends accede bien à l'ensemble des logs, mais il indique un message d'erreur, alors que logs contiennent des données :

The following log file contains no data or invalid data: http://ftp://10.11.131.6\Datasource1\dcs-2008-06-09-24-00214-dlxwtrendsd0.log

Question :

Y a t il obligation de nommer les fichiers de log d'une maniere precise ?
Y a t il un entete à créer pour que webtrends reconnaisse les fichiers logs éclatés?
Les fichiers logs eclatés pour chaque datasource peuvent ils etre placé dans des sous dossier, ou doivent il etre regroupés sous un seul et meme dossier ?

On avance petit a petit, mais on avance.

On aura pas la possibilité de monter un serveur IIS pour le SDC, pour cause de faille de securite...

Merci a tous pour avoir lu mes messages, et pour les reponses que vous me faites...
Journalisée
Guillaume
Néophyte
*
Hors ligne Hors ligne

Messages: 16


Voir le profil
« Répondre #7 le: Juin 11, 2008, 11:05:27 »

Bonjour,

Ca m'étonne qu'il soit impossible de spliter les fichiers logs avec la version Apache de SDC mais je suis dans le même cas que Jacques, j'ai toujours travaillé avec la version IIS! Donc je ne peux malheureusement pas le confirmer. Par contre, si c'est le cas, ça doit être mentionné dans la documentation...
As-tu bien supprimé les caractère de commentaire (#) au début de la ligne "splitlogs=true"? Et as-tu bien redémarré Apache? Ou éventuellement tout le serveur pour être certain?

En tous cas, point de vue de l'utilisation de grep, il faut probablement s'arranger pour que le header du fichier d'origine se retrouve dans les fichiers splittés pour que ça fonctionne.

De plus, il est possible que les passages à la ligne Windows Vs Unix posent problème également! Le grep encode-t-il ses fichiers textes de la même façon que les fichiers d'origine?

Le nom et l'emplacement des fichiers n'a pas spécialement d'importance, du moment que ces fichiers sont accessibles par les datasources Webtrends.
Je conseille quand-même de regrouper les fichiers d'une datasource dans un même dossier de manière à pouvoir utiliser des wildcards (*) dans le chemin d'accès aux logs.

Guillaume.
Journalisée
Pages: [1]
Imprimer
Aller à:  

Flux RSS du forum  Flux RSS Powered by SMF 1.1.11 | SMF © 2006-2007, Simple Machines LLC
Page générée en 0.148 secondes avec 23 requêtes. (Pretty URLs adds 0.016s, 2q)

Google a visite cette page Septembre 04, 2010, 05:15:55