Китайцы
18-09-2010 10:46
к комментариям - к полной версии
- понравилось!
Я не слышал/читал слова китайца про ненужность лингвистики, поэтому не могу судить, имел ли он в виду именно полный отказ от каких-либо средств оптимизации структур данных. Скорее всего, нет - если введение десятка правил позволит на порядки сократить объем и время, то вряд ли он будет для чистоты эксперимента ими пренебрегать. Другое дело, что это могут быть не лингвистические правила, а правила преобразования и ассоциирования строк. Скажем, для построения фразы с согласованными падежами хранить ассоциации слов с суффиксами и окончаниями слов, и частоты суффиксов у сочетаний слов. Из которых правила не формализированные, а статистические, могут проявлятся сами, например, выяснить, что цепочки -ого -а (белого снега) бывают, а -ого -ом (белого снегом) не бывают. Конечно, это могли бы сказать и лингвисты, но даже лингвисты запарятся составлять несколько десчтков тысяч таких правил, да еще и для пятидесяти языков.
вверх^
к полной версии
понравилось!
в evernote