Лучшие text-segmentation вопросы ИТ разработчиков

  • 12 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Разделение абзацев на предложения с помощью регулярных выражений и PHP

m регулярное выражение noob и пытается разбить абзацы на предложения. В моем языке мы используем довольно много сокращений (например, bl.a.) в середине предл...

Задан 06 Apr 2013, 14:14 от acrmuui
  • 6 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Статистический подход с разделением слов

Я хочу решить проблему разделения слов (разбирать слова из длинной строки без пробелов). Например, мы хотим извлечь слова изsomelongword в[some, long, word]. Мы можем добиться этого с помощью некоторого динамического подхода со словарем, но ...

Задан 12 Mar 2012, 10:37 от mishadoff
  • 11 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Как разделить слова в «предложении» пробелами?

ФонНужна автоматизация создания доменов в JasperServer. Домены - это «просмотр» данных для создания специальных отчетов. Имена столбцов должны быть представл...

Задан 04 Oct 2010, 15:24 от Dave Jarvis
  • 8 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

Работал нормально для меня.

аюсь написать функцию для очистки ввода пользователя. Я не пытаюсь сделать его идеальным. Я предпочел бы иметь несколько имен и сокращений в нижнем регистре, чем полный абзац в верхнем регистре. Я думаю, что функция должна использовать ...

Задан 21 Mar 2011, 20:46 от Enkay
  • 3 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

регулярное выражение для извлечения предложения из абзаца в Python

Я пытаюсь извлечь предложение из абзаца, используя регулярные выражения в Python. Обычно код, который я тестирую, правильно извлекает предложение, но в следующем параграфе предложение извлекается неправильно. Параграф: «Но в случае малярийных ...

Задан 11 Dec 2011, 15:59 от martan
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

@Sushant Вы хотите сохранить каждый обрезанный контур в отдельном изображении? просто сохраните каждый из обнаруженных контуров как изображение. это оно.

аюсь построить систему распознавания рукописного ввода, используя python и opencv. Распознавание символов - это не проблема, а сегментация. Я успешно: сегментировал слово на отдельные символысегментированныйодно предложениев слова в необходимом ...

Задан 18 Sep 2017, 15:09 от Sidharth Ramesh
  • 12 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Разделение абзацев на предложения с помощью регулярных выражений и PHP

Я регулярный пользователь noob и пытаюсь разбить абзацы на предложения. В моем языке мы используем довольно много сокращений (например, bl.a.) в середине предложений, поэтому я пришел к выводу, что мне нужно искать знаки препинания, за которыми ...

Задан 06 Apr 2013, 16:14 от acrmuui
  • 8 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Python извлечь предложение, содержащее слово

Я пытаюсь извлечь из текста все предложение, содержащее указанное слово. txt="I like to eat apple. Me too. Let's go buy some apples." txt = "." + txt re.findall(r"\."+".+"+"apple"+".+"+"\.", txt)но это возвращает меня [".I like to eat apple. Me ...

Задан 16 Apr 2013, 09:03 от user2187202
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Регулярное выражение, чтобы соответствовать первое слово в предложении

Я ищу регулярное выражение, соответствующее первому слову в предложении, исключая знаки препинания и пробелы. Например: «Это» в «Это предложение». и «Первый» в «Во-первых, я бы хотел сказать« Привет! »» Это не ...

Задан 08 Feb 2013, 06:38 от princess of persia
  • 28 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

В поисках открытой реализации обнаружения плагиата, которая может быть с китайским.

формулировано в вопросе, я ищу бесплатный и / или открытый текстовый алгоритм сегментации текста для китайского языка, я понимаю, что это очень трудная задача, так как возникает много двусмысленностей. Я знаю, что есть API Google, но это скорее ...

Задан 29 Apr 2011, 15:59 от Sebastian
  • 52 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Вы можете попробовать это сделать:

аюсь преобразовать строку в список слов, используя Python. Я хочу взять что-то вроде следующего: string = 'This is a string, with words!'Затем преобразуйте во что-то вроде этого: list = ['This', 'is', 'a', 'string', 'with', 'words']Обратите ...

Задан 31 May 2011, 00:09 от rectangletangle
  • 15 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

Это просто распознает язык, но не дает никаких функций НЛП. Мне просто нужно разделить текст на предложения, а это не позволяет.

ел бы разделить текст на предложения в PHP. В настоящее время я использую регулярное выражение, которое дает точность ~ 95% и хотелось бы улучшить его, используя лучший подход. Я видел инструменты NLP, которые делают это в Perl, Java и C, но не ...

Задан 17 Feb 2011, 17:14 от Noam
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Регулярное выражение, чтобы соответствовать первое слово в предложении

Я ищу регулярное выражение, соответствующее первому слову в предложении, исключая знаки препинания и пробелы. Например: "Это" в "Это предложен...

Задан 08 Feb 2013, 05:38 от princess of persia