Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
DmitryShm
Зарегистрирован: 17.11.2003 Сообщения: 211 Откуда: Казань
|
Добавлено: Чт Июл 15 2004 09:25 Заголовок сообщения: задачка для программистов, не для юзеров :) |
|
|
Задача: представить класс числительного. Числительное - это, например, "25 метров" или "7 сладких яблок", т.е. число + <идентификатор числительного>. Сам класс (пришлось сделать небольшую иерархию классов) уже представлен. Осталось разобраться с 2 функциями: 1) из строки возвращает число и соответствующее ему ПРЕДПОЛОЖИТЕЛЬНОЕ измерение (<идентификатор числительного>), строка состоит из 2 токенов (неразделенных разделяющими знаками) 2) функция анализирует, является ли пара числа с измерением правильным числительным.
Вот и все: проекты и предложения прошу слать мне на ящик, и, что еще лучше, публиковать здесь.
|
|
Вернуться к началу |
|
|
droopy Гость
|
Добавлено: Чт Июл 15 2004 09:51 Заголовок сообщения: |
|
|
на чем пишешь. ты что состроками работать не умеешь?
поясни в чем проблема с этими фунцкиями. почему сам не можешь написать? |
|
Вернуться к началу |
|
|
DmitryShm
Зарегистрирован: 17.11.2003 Сообщения: 211 Откуда: Казань
|
Добавлено: Чт Июл 15 2004 16:05 Заголовок сообщения: вариант ответа |
|
|
На Java. Но это не важно, на чем. Со строчками я умею работать, но проблему-то я другую обозначил -- вычислить числительное -- а это не так-то просто.. Словарь с падежами, и.т.д.. сразу не подходит. Тем более, что у меня базовый класс позволяет писать производные числительные для любых языков. Нужно вычислить, например, для русского языка. Еще сложности добавляет то, что возможно расширение алгоритма для наличия прилагнательных и союзов в идентификаторе числительного (25 тяжелых мешков с цементом). Но это уже потом.
Сам-то напишу, только хочется и ваши предложения послушать. Еще 2 человек над этим 1 неделю бьются, и даже вариант со словарем криво сделали. Так что на них надежды уже нет: придется самому.
Алгоритм должен обрабатывать токены и решать сам, что есть числительное, а что нет. Ведь в книгах, например, могут быть совсем придуманные слова, которые могут входить в числительный. |
|
Вернуться к началу |
|
|
droopy Гость
|
Добавлено: Чт Июл 15 2004 18:26 Заголовок сообщения: |
|
|
предлагаю так:
как известно окончание чего-либо после числительного завист
от последней цифры числительного. для каждого чего-то создаешь массив из названий чего-то для каждой последней цифры, хранишь именгительный падеж. далее проверка на правильность: просто сравниваешь с массивами названий. это годится конечно если можно задать эти массивы. если же в качестве числительного годится все что угодно тогда нужно тработать с правилами языка. |
|
Вернуться к началу |
|
|
DmitryShm
Зарегистрирован: 17.11.2003 Сообщения: 211 Откуда: Казань
|
Добавлено: Пт Июл 16 2004 11:37 Заголовок сообщения: reply |
|
|
Цитата: | .. работать с правилами языка .. |
|
|
Вернуться к началу |
|
|
wildwind
Зарегистрирован: 03.02.2004 Сообщения: 268 Откуда: Москва
|
Добавлено: Пт Июл 16 2004 12:28 Заголовок сообщения: Re: задачка для программистов, не для юзеров :) |
|
|
DmitryShm писал(а): |
Осталось разобраться с 2 функциями:
1) из строки возвращает число и соответствующее ему ПРЕДПОЛОЖИТЕЛЬНОЕ измерение (<идентификатор числительного>), строка состоит из 2 токенов (неразделенных разделяющими знаками)
2) функция анализирует, является ли пара числа с измерением правильным числительным. |
1) идентификатор должен возвращаться именно в именительном падеже?
"неразделенных разделяющими знаками" - это что значит?
2) Что есть правильное числительное? Примеры неправильных. |
|
Вернуться к началу |
|
|
DmitryShm
Зарегистрирован: 17.11.2003 Сообщения: 211 Откуда: Казань
|
Добавлено: Пт Июл 16 2004 16:37 Заголовок сообщения: правильно так.. :) |
|
|
Неправильное числительное -- это 25 яблоков, а правильное, например, 3 фиготени. Т.е. если вычислять, то фиготень - существительное, а яблоков после 25 писать неправильно. Но здесь есть проблема : "фиготени" -- может быть в именительном падеже. Т.е. при возникновении коллизий нужно как-то уметь их разрешать.
"Неразделенные разделителями" -- это в смысле того, что некоторые знаки можно считать разделителями токенов, а некоторые -- нет. Пример: 3 кислых яблока, идентификатор -- кислое яблоко, и пробел между этими словами разделителем не является. В другом случае -- 11 помидор незрелых -- пробел будет разделителем. А вообще, разделитель - это символ (любой, который пожелаешь). В реализации токенизиров на всех языках разделителями по умолчанию являются знаки \n, ' ', \t, и. т. д.. Есть идея для облегчения труда и улучшения архитектуры переписать класс токенизера, чтобы сам решал что является разделителем, а что нет. Таким образом продукт, который получим, будет очень полезен при разработке текстовых процессоров. |
|
Вернуться к началу |
|
|
GREA
Зарегистрирован: 14.05.2003 Сообщения: 758 Откуда: Новосибирск
|
Добавлено: Пт Июл 16 2004 19:18 Заголовок сообщения: |
|
|
Простой пример (о будущих граблях):
Выпить 2 стакана кофе со сливками
Перемешать 2 стакана кофе со сливками
Во втором случае сливки выступают отдельным объектом.
Тем не менее оба предложения построены изоморфно.
Таким образом, однозначно определить структуру в этом случае можно только исходя из контекста, а не алгоритмически.
Пример не совсем удачный, но все же... |
|
Вернуться к началу |
|
|
DmitryShm
Зарегистрирован: 17.11.2003 Сообщения: 211 Откуда: Казань
|
Добавлено: Сб Июл 17 2004 14:55 Заголовок сообщения: находит.. |
|
|
Уточняю. Задача состоит в том, чтобы доставить МИНИМАЛЬНОЕ числительное. В том смысле, что в тех предложениях числительным будет "2 стакана".
|
|
Вернуться к началу |
|
|
Shrek Гость
|
Добавлено: Сб Июл 24 2004 12:40 Заголовок сообщения: |
|
|
1. Создать базу данных. В этой базе должны быть также и слова исключения.
2. Создать алгоритм для синтактического разбора слов из базы данных
с учетом правил русского языка
Без базы данных нечего не получиться. |
|
Вернуться к началу |
|
|
|