Marina Komarova Гость
|
Добавлено: Ср Окт 23 2002 17:04 Заголовок сообщения: проблемы с учетом посещаемости |
|
|
Hi all! Вопросов несколько, все по одной теме, поэтому позволю себе длинное предисловие. Веду небольшой сайт, порядка 50 страниц, про услуги фирмы, где я работаю. C этой осени стала анализировать посещаемость, не только spylog` ом (на платный сервис которого денег никто не дает, и соответственно получаю минимальный сервис и только за 10 дней), но и своим perl-скриптом. Написала по образу и подобию имеющегося в инете с интересующими лично меня возможностями. Способ использую вполне типовой (по моим познаниям): на странице картинка в 1 пиксель, к-я выводится скриптом, к-ый , в свою очередь, анализирует $ENV{‘HTTP_REFERER’} и записывает посещаемость в один файл, а ключевые слова, по которым ко мне с поисковиков пришли – в другой. Отчет смотрю по адресу www.labdiagn.h1.ru/cgi-bin/see_count4.pl И вот какие возникли проблемы. 1. Во многих случаях названия страницы нет. Я нашла только одну причину, как такое может выйти: страница сохранена на локальном диске, включая ссылку на скрипт, (к интернету комп. подключен). Скрипт вызывается, но данная ENV не образуется. Единственная ли это причина? if да, значит ли, что действительно мои страницы люди копируют себе? Как узнать какие именно?
2. Попадают примерно с таких запросов: yandpage%3F&q0=903578549&p0=1&d0=17&a0d0=170& a1d0=0& url=http%3A%2F%2Flabdiagn%2Eh1%2Eru%2Fpapilloma%2Eshtml&text = %D0%D2%C5%C9%CD%D5%DD%C5%D3%D4%D7%C1%20%D2%C9%C6%20%C4%C9%C1 %C7%CE%CF%D3%D4 %C9%CB%C9%20%D0%C5%D2%C5 %C4%20%D0%C3%D2 Я их декодирую, как обычно с данными из формы s/%([a-fA-F0-9][a-fA-F0-9])/pack("C", hex($1))/eg;
В большинстве (но как недавно выяснилось не всегда) получаются русские буквы в кодировке koi8. Другие русские буквы в файле просмоторщике выходят в кодировке win1251. Почему ??? Стремно как-то 2 разные кодировки на одной странице созерцать. Я ничего умнее не нашла, как засунуть перекодировщик из koi в win в скрипт собирающий ключевые слова. Наверное, должно быть более красивое решение?
3. Откуда могли взяться страницы, которых у меня отродясь не было???
4. Какие гарантии, что никто не придет (с поисковиков или еще как) на страницы, к-е генерятся скриптами? Ничего на них такого секретного нет, просто я всякое разное на них отрабатываю. |
|