Вопрос по – Проверка орфографии с открытым исходным кодом

12

Оценивал добавление проверки орфографии к продукту, которым я владею. Согласно моему исследованию основные решения, которые должны быть приняты:

The library to use.
Dictionary( this can be region specific, British english, American etc).
Exclusion lists. Anytime a typo is detected its possible that its not a typo but is verbiage specific to the user. At this point the users should be given the ability to
add this to his custom exclusion list.
Besides a per user custom list also a list of exclusion based on the user space of the clients of the tool. That is terms/acronyms in the users work domain. For example FX will not be a typo for currency traders.

Открытые вопросы, которые у меня были, перечислены ниже, и если бы я мог получить вклад в них, это было бы очень полезно. Вначале я думал о hunspell, который является библиотекой с открытым исходным кодом, предлагаемой под MPL, и используется продуктами семейства firefox и OpenOffice. Есть какие-нибудь страшные истории, использующие это? Есть ли серые зоны с лицензированием? Проверка орфографии будет происходить на клиенте Windows.

Словари доступны из различных источников, некоторые из которых бесплатны по MPL, а некоторые - нет. Любые предложения по хорошим источникам для бесплатных словарей.

Многоязычная поддержка и что нужно разработать, чтобы поддержать их?

Для 4, как пользовательские словари синхронизируются со стороной сервера и со стороны клиента? Проверка орфографии должна происходить на стороне клиента, поэтому каждый раз при первом запуске они отталкиваются или синхронизируются очень часто?

Windows не веб-основе. он будет отправлен как клиентская установка. HeretoLearn
Какой язык программирования / платформа вы используете? Chris Pietschmann

Ваш Ответ

4   ответа
1

Вот хорошая демонстрация Питера Норвига: я нахожу это простое объяснение гораздо более интуитивным. Перейдите по ссылкам в документе для более глубокого анализа.

http://norvig.com/spell-correct.html

10

Как уже упоминалосьHunspell это современная проверка орфографии. Это проверка орфографии Open Office, Thunderbird, Firefox и Google Chrome. Доступны порты для всех основных языков программирования. Он работает с каталогами Open Office, поэтому поддерживается множество языков.

2

Существует несколько широко используемых вариантов зрачка: myspell, aspell. Проверь их.

Hunspell основан на MySpell и немного более продвинут.
3

Я использовалHunspell для некоторых вещей, и у меня действительно нет никаких ужасных историй с этим. Я использую его только с английским (американским), но он утверждает, что работает с другими языками.

Что касается лицензирования, он предлагает на выбор GPL, LGPL и MPL. Если вам не нравится MPL, вы всегда можете выбрать LGPL.

Похожие вопросы