Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
nikyev Гость
|
Добавлено: Чт Мар 06 2003 15:18 Заголовок сообщения: прога - сборщик мыл из нета под фри ? |
|
|
Слыхал кто-нить про такое чудо? Что-нибудь вроде аналога мэйл-экстрактора, но чтоб под фрю работало? |
|
Вернуться к началу |
|
|
and3008
Зарегистрирован: 12.10.2001 Сообщения: 14893 Откуда: Н.Новгород
|
Добавлено: Чт Мар 06 2003 18:52 Заголовок сообщения: Спамом решил заняться? Не помогу из принципиальных соображений (-) |
|
|
- |
|
Вернуться к началу |
|
|
nikyev Гость
|
Добавлено: Пт Мар 07 2003 09:03 Заголовок сообщения: Нет, не спамом. Если интересно - объясняю... |
|
|
У мена проект - фонетический анализ имен электронной почты, выбираемых в зависимости от этнической принадлежности (имею в виду - домены ру, аз и т.д.). Морду-то бить зачем? Кто тут про спам говорит? Можно, конечно, и спам-листы купить, но я не уверен в их корректности, лучше уж самому нащелкать. Пробовал халявными прогами под винды, но они все со своими глюками. |
|
Вернуться к началу |
|
|
and3008
Зарегистрирован: 12.10.2001 Сообщения: 14893 Откуда: Н.Новгород
|
Добавлено: Пт Мар 07 2003 09:14 Заголовок сообщения: Глепая затея (+) |
|
|
Сервер может быть физически расположен в России, а зарегистрирован в зоне .com, .ua или еще какой тьму-таракани.
Так что полезность такого разбора весьма сомнительна. |
|
Вернуться к началу |
|
|
nikyev Гость
|
Добавлено: Пт Мар 07 2003 09:24 Заголовок сообщения: Правда ? :-) |
|
|
Ну, глупая, не глупая - мне за это деньги платят, а кому это надо - мне по барабану. И сам проект мне интересен. Не имеет значения, где расположен сервак. НЕ русскоязычный пользователь не будет делать себе ящик под доменом ру. А первая часть проекта - именно анализ действий русскоязычных пользователей интернета. Смысл в том, чтобы получить как можно больше закономерностей при выборе имен, даже если эти самые закономерности притянуты за уши - раз люди тратят на это деньги, значит им это надо. Сэр, спасибо, конечно, большое за разъяснение независимости имени домена первого уровня от физического расположения машины, но может быть Вы в состоянии помочь чем-то еще, не менее полезным? |
|
Вернуться к началу |
|
|
ALEX_SE Гость
|
Добавлено: Пт Мар 07 2003 10:07 Заголовок сообщения: Насчет "язычности" пользователей и доменов не факт. Почему он не будет делать? (-) |
|
|
- |
|
Вернуться к началу |
|
|
ALEX_SE Гость
|
Добавлено: Пт Мар 07 2003 10:08 Заголовок сообщения: Добавлю - особенно взять домен com. Его использует кто не лень... (-) |
|
|
- |
|
Вернуться к началу |
|
|
nikyev Гость
|
Добавлено: Пт Мар 07 2003 10:25 Заголовок сообщения: ну и ладушки, это ж статистика, большие числа.... |
|
|
Да пусть использует. Сколько из миллиона пользователей домена ру будет НЕрусскоязычными? Господа, кажется мой простой вопрос легко перерастает в беседу на тему "какого хрена солнце светит?". Объясню подробно. 1)Задача максимум - просчитать все возможнные закономерности выдумывания имени, определить ("притянуть за уши") любые соотношения имен к данным из предоставляемых заказчиком словарей. Мне за это платят зарплату + премиальные. Как психологу мне это очень интересно. Если это интересно и вам, то результатами и способами, которыми эти результаты были получены, буду делиться по ходу действия с удовольствием. 2) Задача минимум - получить для анализа возможно большее количество бессистемно надерганных электронных адресов. Продаваемые спам-листы не подходят по нескольким причинам, главная из которых - чистота эксперимента не соблюдается, т.к. нет данных о методах сбора адресов. Не усредненные они, слишком тематические. А нужны большие числа, большие вероятности. Т.е. - пусть там будет все, и выбранные коллегиально имена (допустим - на предприятии долго думали всем коллективом и придумали), и выбранное изнемогающим онанирующим стареньким дядечкой, и что-то типа superhacker@ляля.ру, и т.д. Адреса должны быть выбраны, выловлены бессистемно. Плюс - документация по способу и датам вылавливания должна быть прилагаема. Помочь можете - помогите. А нет - так о чем мы тогда разговариваем? Нужна прога под фри (сервак на выделенке под ней бегает). Виндовские, какие я смог нарыть - или медленные очень, или глючные. На сбор адресов у меня месяц, не больше. Самая быстрая виндовая прога собирает 4000 адресов за сутки работы при ширине канала 64 кило. |
|
Вернуться к началу |
|
|
Dmitry.Karpov http://prof Гость
|
Добавлено: Пт Мар 07 2003 13:04 Заголовок сообщения: Берем в пакаджах программу wget, читаем ее доки, учим ее кидать на stdout и пишем свой фильтр, вылавливаюий адреса (-) |
|
|
- |
|
Вернуться к началу |
|
|
nikyev Гость
|
Добавлено: Пт Мар 07 2003 13:12 Заголовок сообщения: Как всегда - единственный полезный совет даешь ты:-) Опять спасибо! |
|
|
А то чего тут только не происходит - и спаммер я ...ый, и - объясняю, зачем мне это надо - жизни учить начинают. Все умные, все во всем разбираются, а посоветовать толком - Дима Спасибо еще раз! Ты с ней работал? Быстрая штука? У меня время ограничено на сбор мыл, за месяц по проекту надо надрать мильончик, да чтобы системы в надирании не было. |
|
Вернуться к началу |
|
|
and3008
Зарегистрирован: 12.10.2001 Сообщения: 14893 Откуда: Н.Новгород
|
Добавлено: Пт Мар 07 2003 13:46 Заголовок сообщения: Спасибо говорить рано, ибо это 10% от общей задачи. Скорость зависит от скорости работы стека TCP (-) |
|
|
- |
|
Вернуться к началу |
|
|
nikyev Гость
|
Добавлено: Пт Мар 07 2003 13:52 Заголовок сообщения: Зато уже есть с чем ковыряться:-) По-любому должно быть быстрее и лучше, чем с виндовых прог |
|
|
wget поставил, теперь доки читать буду. Спасибо еще раз |
|
Вернуться к началу |
|
|
and3008
Зарегистрирован: 12.10.2001 Сообщения: 14893 Откуда: Н.Новгород
|
Добавлено: Пт Мар 07 2003 14:52 Заголовок сообщения: Сильно я сомневаюсь, что будет лучше (+) |
|
|
wget - это программа закачки файлов. Она не оптимизирована для твоей задачи, так что чуда не будет.
Раз пошла такая пьянка, то я написал бы подобную прогу на Перле и запускал бы их сразу кучу, а вывод в базу данных. |
|
Вернуться к началу |
|
|
nikyev Гость
|
Добавлено: Пт Мар 07 2003 14:59 Заголовок сообщения: А готовых роботов нету? |
|
|
На перле я не пишу, на сишнике - да, но на это и времени куча нужна... Если, как Dmitry.Karpov советует, пихать не в файл? Правда, я еще не разобрался во всех настройках wgeta. |
|
Вернуться к началу |
|
|
and3008
Зарегистрирован: 12.10.2001 Сообщения: 14893 Откуда: Н.Новгород
|
Добавлено: Вс Мар 09 2003 11:45 Заголовок сообщения: Наверняка есть, иначе люди не получали бы кучу спама(-) |
|
|
- |
|
Вернуться к началу |
|
|
|