Simbiontes
Cada loco con su tema   

Blog |  Acerca de...  |  Asuntos recurrentes  | 

Tuning de la configuración de Webalizer

Escrito por El Malvado Acidonitrix , Miércoles 27 de Abril de 2005
   1 Comentarios
Archivado en: Codeblog

Cómo mejorar la configuración de webalizer para obtener unas estadísticas decentes.

El fichero de configuración de webalizer viene con unas opciones de serie que casi nadie toca y que son bastante nefastas. Algunos pequeños cambios hacen que tus estadísticas cundan más, especialmente mostrando los términos de búsqueda y los referrer.

Te mostramos cómo modificamos nuestro fichero de configuración. Recuerda que para poder hacerlo, necesitas un acceso especial al servidor. No tiene que ser necesariamente un acceso de administración. Utiliza estas líneas como pistas, pero si no estás seguro de qué es lo que haces, es mejor que no lo toques...

Algunas aclaraciones importantes
Si el párrafo anterior no te ha amedrentado, entonces deberías conocer los cuatro puntos débiles que hacen que webalizer no sea muy eficiente en sus configuraciones: referrers, tiempos de visita, informes completos y cadenas de buscadores.

  1. Referrers, o gente que enlaza a tu web y desde la que llegan visitas. Por defecto, la etiqueta HideReferrer no tiene valor, por lo que tus propios referrers "ahogan" a los externos. Poniendo tu dominio consigues ver con claridad las visitas externas.
  2. Tiempo de visita. VisitTimeout Entre dos peticiones desde una IP, debe pasar un tiempo para que se consideren visitas separadas. El valor por defecto es media hora (1800 segundos). Si usas distintas herramientas de análisis de logs que tengan distintos tiempos de visita, los resultados serán distintos.
  3. Informes completos. AllReferrers y DumpReferrers. (Hay otras). Disponibles en html y texto sin formato con separadores de campos. Por defecto no se generan y te pierdes un montón de información.
  4. Y, por supuesto, las cadenas de buscadores (SearchEngine), que son obsoletas y si no las cambias pierdes un montón de información. Sobre este asunto ya hemos hablado en http://www.simbiontes.com/archives/000111.php y en http://www.simbiontes.com/archives/000109.php.

Hay más detalles en ftp://ftp.mrunix.net/pub/webalizer/README. Para cambiar el fichero de configuración, lo encontrarás en /etc/webalizer.conf. Salva tu experimento con otro nombre, e invoca a webalizer con la opción -c, que sirve para indicar que no quieres usar el fichero por defecto:

/usr/bin/webalizer -c /etc/webalizer.conf.experimento [por ejemplo]

 

Lo que sigue no es el fichero de configuración completo, sino un extracto con las etiquetas que cambiamos.

#Archivos que cuentan como páginas para las visitas
PageType htm*
PageType cgi
# los dos siguientes suelen venir comentados y
# en todo caso son formas en desuso de ficheros PHP

PageType phtml
PageType php3
# Este formato es más amplio
PageType php*

# añade otros formatos si tu web tiene otras extensiones

# Este parámetro es importante porque determina el número de visitas que recibes.
# En el artículo que acompaña este ejemplo hay un comentario más prolijo sobre esto.

#VisitTimeout 1800

# Estos son los valores por defecto que muestra el informe de estadística
# para mostrar más datos por cada epígrafe, modifica el valor numérico

TopSites 30
TopKSites 10
TopURLs 30
TopKURLs 10
TopReferrers 30
TopAgents 15
TopCountries 30
TopEntry 10
TopExit 10
TopSearch 20
TopUsers 20

# Los siguientes valores indican si se genera un informe paralelo que recoja
# todos los registros de cada una de estas categorías.
# el enlace aparece en la tabla correspondiente del informe general.
# (por ejemplo, allsites aparece el resumen de TopSites.)
# Este informe se genera en html. Puedes generarlo también como un volcado (DUMP, ver
# más adelante) en texto plano con separadores,
# que puedes exportar a excel o tratar con un script.
# LA MALA NOTICIA es que el volcado se trunca a veces.
# La BUENA, que el fichero html es bastante tratable con un script...

AllSites yes
AllURLs yes
AllReferrers yes
AllAgents yes
AllSearchStr yes
AllUsers yes


# Webalizer considera que http://tupagina.com/ y http://tupagina.com/index.html
# son el mismo documento y agrupa ambas peticiones en una sola a efectos de cómputo.
# Si tu web tiene la página principal con otro nombre, indícalo aquí.

#IndexAlias home.htm
#IndexAlias homepage.htm

# Puedes usar nombre o dirección IP para que tus visitas no cuenten
# Your own site should be hidden
#HideSite *mrunix.net
#HideSite localhost
HideSite 255.255.255.255 # CAMBIA ESTO POR TU DIRECCIÓN IP.
# Si no sabes cuál es, visita http://www.ibercom.es y la verás en la parte
# superior derecha de la página

# Your own site gives most referrals
# Este parámetro oculta tus propios referrers
# y deja que se vean mejor los externos

#HideReferrer mrunix.net/
HideReferrer *.simbiontes.com # pon aquí tu dominio...

# Usually you want to hide these
# si no tienes especial interés en ver qué imágenes se sirven, usa estas líneas
HideURL *.gif
HideURL *.GIF
HideURL *.jpg
HideURL *.JPG
HideURL *.png
HideURL *.PNG
HideURL *.ra

# Usa estas líneas para no mostrar determinadas páginas, referrers, etc.
#IgnoreSite bad.site.net
#IgnoreURL /test*
#IgnoreReferrer file:/* #Oculta llamadas desde páginas guardadas en un disco e informes generados en local
#IgnoreAgent RealPlayer
#IgnoreUser root
# Example: Only show stats on Joe User's pages...
#IgnoreURL *
#IncludeURL ~joeuser*
# Or based on an authenticated username
#IgnoreUser *
#IncludeUser someuser

# MangleAgents te permite simplificar la variedad de navegadores en grupos pequeños
# tienes hasta 6 valores posibles, que van desde diferenciar
# cada variante del I.E 6, hasta hacer
# que todos los mozilla se agrupen en un único epígrafe. Más info en:
# ftp://ftp.mrunix.net/pub/webalizer/README
#MangleAgents 0

# Buscadores. Sobre esto ya hemos hablado aquí:
# esta configuración nos funciona bastante bien...
SearchEngine yahoo.com p=
SearchEngine altavista.com q=
SearchEngine google. q=
#cache google
SearchEngine translate_hl q=
SearchEngine search?as_q q=
SearchEngine eureka.com q=
SearchEngine lycos.com query=
SearchEngine hotbot.com MT=
SearchEngine msn. q=
SearchEngine infoseek.com qt=
SearchEngine webcrawler searchText=
SearchEngine excite search=
SearchEngine netscape.com search=
SearchEngine mamma.com query=
SearchEngine alltheweb.com query=
SearchEngine northernlight.com qr=


#Los volcados ("dumps") son ficheros de texto plano con diversos informes
# puedes escoger la ruta donde quieres que se guarden
# la extensión, el separador, etc.
# El más interesante es referrers y search, pero debes saber que no siempre
# funcionan (el fichero se trunca, no sabemos por qué).
# Pero no todo está perdido: en las etiquetas AllSites y similares
# obtienes un informe en html
# que con un poco de maña puedes parsear con el mismo resultado

#DumpPath /var/lib/httpd/logs
#DumpHeader no
#DumpExtension tab
#DumpSites no
#DumpURLs no
#DumpReferrers no
#DumpAgents no
#DumpUsers no
#DumpSearchStr no
# End of configuration file... Have a nice day!


1 comentarios

Bla Bla
Dice: tubisuteria.com.ve, Miércoles 24 de Marzo de 2010

Muy buen aporte sobre todo eso de no mostrar las propias estadísticas.
Saludos, y visita http://tubisuteria.com.ve



Enviar un comentario










Introduce el código que aparece aquí...
Recordar información personal en este PC...







Mostrar búsqueda avanzadaActivar búsqueda avanzada

Bienvenido al repositorio de los simbiontes

Una página colectiva y ecléctica para comentar y apuntar cosas.

Estás viendo los archivos de Abril de 2005. Visita la portada para ver las últimas notas.

Sugerencias de lectura

Los simbiontes hablan de...

Sugerencias de lectura

Si quieres curiosear, puedes consultar:

  • todas las entradas archivadas por categoría (abstract).
  • Las entradas ordenadas mensualmente.
  • Suscribirte a los feeds (más abajo).
  • Lo que vienen buscando otras personas.
  • Si lo prefieres, puedes ver la portada en el formato anterior.
  • ...o leer la presentación para saber qué es esto y si puedes fiarte o no de lo que aquí se dice, y por qué pensamos que esto no es un blog aunque lo llamemos así para entendernos entre nosotros.

Sindicación RSS

  • ¿Qué es un feed?
  • Agregadores recomentados

Lecturas edificantes y tráfico de influencias

La tira Ecol

Tira Ecol

http://tira.escomposlinux.org
La tira ecol ha vuelto.