Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Архив форумов ЦИТФорума
Море(!) вопросов - Море(!) ответов
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
Как правильно задавать вопросы

прога - сборщик мыл из нета под фри ?

 
Перейти:  
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Сети
Предыдущая тема :: Следующая тема  
Автор Сообщение
nikyev
Гость





СообщениеДобавлено: Чт Мар 06 2003 15:18    Заголовок сообщения: прога - сборщик мыл из нета под фри ? Ответить с цитатой

Слыхал кто-нить про такое чудо? Что-нибудь вроде аналога мэйл-экстрактора, но чтоб под фрю работало?
Вернуться к началу
and3008



Зарегистрирован: 12.10.2001
Сообщения: 14893
Откуда: Н.Новгород

СообщениеДобавлено: Чт Мар 06 2003 18:52    Заголовок сообщения: Спамом решил заняться? Не помогу из принципиальных соображений (-) Ответить с цитатой

-
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
nikyev
Гость





СообщениеДобавлено: Пт Мар 07 2003 09:03    Заголовок сообщения: Нет, не спамом. Если интересно - объясняю... Ответить с цитатой

У мена проект - фонетический анализ имен электронной почты, выбираемых в зависимости от этнической принадлежности (имею в виду - домены ру, аз и т.д.). Морду-то бить зачем? Кто тут про спам говорит? Можно, конечно, и спам-листы купить, но я не уверен в их корректности, лучше уж самому нащелкать. Пробовал халявными прогами под винды, но они все со своими глюками.
Вернуться к началу
and3008



Зарегистрирован: 12.10.2001
Сообщения: 14893
Откуда: Н.Новгород

СообщениеДобавлено: Пт Мар 07 2003 09:14    Заголовок сообщения: Глепая затея (+) Ответить с цитатой

Сервер может быть физически расположен в России, а зарегистрирован в зоне .com, .ua или еще какой тьму-таракани.

Так что полезность такого разбора весьма сомнительна.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
nikyev
Гость





СообщениеДобавлено: Пт Мар 07 2003 09:24    Заголовок сообщения: Правда ? :-) Ответить с цитатой

Ну, глупая, не глупая - мне за это деньги платят, а кому это надо - мне по барабану. И сам проект мне интересен. Не имеет значения, где расположен сервак. НЕ русскоязычный пользователь не будет делать себе ящик под доменом ру. А первая часть проекта - именно анализ действий русскоязычных пользователей интернета. Смысл в том, чтобы получить как можно больше закономерностей при выборе имен, даже если эти самые закономерности притянуты за уши - раз люди тратят на это деньги, значит им это надо.
Сэр, спасибо, конечно, большое за разъяснение независимости имени домена первого уровня от физического расположения машины, но может быть Вы в состоянии помочь чем-то еще, не менее полезным?
Вернуться к началу
ALEX_SE
Гость





СообщениеДобавлено: Пт Мар 07 2003 10:07    Заголовок сообщения: Насчет "язычности" пользователей и доменов не факт. Почему он не будет делать? (-) Ответить с цитатой

-
Вернуться к началу
ALEX_SE
Гость





СообщениеДобавлено: Пт Мар 07 2003 10:08    Заголовок сообщения: Добавлю - особенно взять домен com. Его использует кто не лень... (-) Ответить с цитатой

-
Вернуться к началу
nikyev
Гость





СообщениеДобавлено: Пт Мар 07 2003 10:25    Заголовок сообщения: ну и ладушки, это ж статистика, большие числа.... Ответить с цитатой

Да пусть использует. Сколько из миллиона пользователей домена ру будет НЕрусскоязычными? Господа, кажется мой простой вопрос легко перерастает в беседу на тему "какого хрена солнце светит?". Объясню подробно. 1)Задача максимум - просчитать все возможнные закономерности выдумывания имени, определить ("притянуть за уши") любые соотношения имен к данным из предоставляемых заказчиком словарей. Мне за это платят зарплату + премиальные. Как психологу мне это очень интересно. Если это интересно и вам, то результатами и способами, которыми эти результаты были получены, буду делиться по ходу действия с удовольствием. 2) Задача минимум - получить для анализа возможно большее количество бессистемно надерганных электронных адресов. Продаваемые спам-листы не подходят по нескольким причинам, главная из которых - чистота эксперимента не соблюдается, т.к. нет данных о методах сбора адресов. Не усредненные они, слишком тематические. А нужны большие числа, большие вероятности. Т.е. - пусть там будет все, и выбранные коллегиально имена (допустим - на предприятии долго думали всем коллективом и придумали), и выбранное изнемогающим онанирующим стареньким дядечкой, и что-то типа superhacker@ляля.ру, и т.д. Адреса должны быть выбраны, выловлены бессистемно. Плюс - документация по способу и датам вылавливания должна быть прилагаема.
Помочь можете - помогите. А нет - так о чем мы тогда разговариваем? Нужна прога под фри (сервак на выделенке под ней бегает). Виндовские, какие я смог нарыть - или медленные очень, или глючные. На сбор адресов у меня месяц, не больше. Самая быстрая виндовая прога собирает 4000 адресов за сутки работы при ширине канала 64 кило.
Вернуться к началу
Dmitry.Karpov http://prof
Гость





СообщениеДобавлено: Пт Мар 07 2003 13:04    Заголовок сообщения: Берем в пакаджах программу wget, читаем ее доки, учим ее кидать на stdout и пишем свой фильтр, вылавливаюий адреса (-) Ответить с цитатой

-
Вернуться к началу
nikyev
Гость





СообщениеДобавлено: Пт Мар 07 2003 13:12    Заголовок сообщения: Как всегда - единственный полезный совет даешь ты:-) Опять спасибо! Ответить с цитатой

А то чего тут только не происходит - и спаммер я ...ый, и - объясняю, зачем мне это надо - жизни учить начинают. Все умные, все во всем разбираются, а посоветовать толком - ДимаSmile
Спасибо еще раз!
Ты с ней работал? Быстрая штука? У меня время ограничено на сбор мыл, за месяц по проекту надо надрать мильончик, да чтобы системы в надирании не было.
Вернуться к началу
and3008



Зарегистрирован: 12.10.2001
Сообщения: 14893
Откуда: Н.Новгород

СообщениеДобавлено: Пт Мар 07 2003 13:46    Заголовок сообщения: Спасибо говорить рано, ибо это 10% от общей задачи. Скорость зависит от скорости работы стека TCP (-) Ответить с цитатой

-
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
nikyev
Гость





СообщениеДобавлено: Пт Мар 07 2003 13:52    Заголовок сообщения: Зато уже есть с чем ковыряться:-) По-любому должно быть быстрее и лучше, чем с виндовых прог Ответить с цитатой

wget поставил, теперь доки читать буду. Спасибо еще разSmile
Вернуться к началу
and3008



Зарегистрирован: 12.10.2001
Сообщения: 14893
Откуда: Н.Новгород

СообщениеДобавлено: Пт Мар 07 2003 14:52    Заголовок сообщения: Сильно я сомневаюсь, что будет лучше (+) Ответить с цитатой

wget - это программа закачки файлов.
Она не оптимизирована для твоей задачи, так что чуда не будет.

Раз пошла такая пьянка, то я написал бы подобную прогу на Перле и запускал бы их сразу кучу, а вывод в базу данных.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
nikyev
Гость





СообщениеДобавлено: Пт Мар 07 2003 14:59    Заголовок сообщения: А готовых роботов нету? Ответить с цитатой

На перле я не пишу, на сишнике - да, но на это и времени куча нужна... Если, как Dmitry.Karpov советует, пихать не в файл? Правда, я еще не разобрался во всех настройках wgeta.
Вернуться к началу
and3008



Зарегистрирован: 12.10.2001
Сообщения: 14893
Откуда: Н.Новгород

СообщениеДобавлено: Вс Мар 09 2003 11:45    Заголовок сообщения: Наверняка есть, иначе люди не получали бы кучу спама(-) Ответить с цитатой

-
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Сети Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2002 phpBB Group
Русская поддержка phpBB

 

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 6608306, ICQ 232284597
Пресс-релизы — pr@citforum.ru
Послать комментарий
Информация для авторов
This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2006 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...