Лучшие levenshtein-distance вопросы ИТ разработчиков

  • 28 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как добавить функцию Левенштейна в MySQL?

Я получил код для расстояния Левенштейна для формы mysql "http://kristiannissen.wordpress.com/2010/07/08/mysql-levenshtein/", но как добавить эту функцию в mysql? Я использую xampp, и мне это нужно для поиска в php.

Задан 17 Dec 2012, 07:19 от Sandesh Sharma
  • 50 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

Как рассчитать меру подобия расстояния для заданных 2 строк?

Мне нужно рассчитать сходство между 2 строками. Так что именно я имею в виду? Позвольте мне объяснить на примере: Настоящее слово:hospitalОшибочное слово:haspitaТеперь моя цель - определить, сколько символов мне нужно, чтобы изменить ошибочное ...

Задан 26 Feb 2012, 14:05 от MonsterMMORPG
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

MySQL, смешивающий Damerau – Levenshtein Fuzzy с Like Wildcard

Недавно я реализовал UDF алгоритмов Дамерау – Левенштейна в MySQL, и мне было интересно, есть ли способ объединить нечеткое сопоставление алгоритма Дамерау – Левенштейна с подстановочным поиском функции Like? Если у меня есть следующие данные в ...

Задан 10 Jan 2013, 15:39 от user1236443
  • 6 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Расстояние ошибки Левенштейна c # count тип

Я нашел этот кусок кода, который вычисляетРасстояние Левенштейна [http://en.wikipedia.org/wiki/Levenshtein_distance]между ответом и предположением: int CheckErrors(string Answer, string Guess) { int[,] d = new int[Answer.Length + 1, Guess.Length ...

Задан 21 Mar 2013, 22:42 от user1988332
  • 38 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Алгоритм нечеткого поиска (алгоритм приблизительного сопоставления строк)

Я хочу создать алгоритм нечеткого поиска. Тем не менее, после нескольких часов исследований я действительно борюсь.Я хочу создать алгоритм, который выполняет...

Задан 01 Sep 2015, 16:58 от Yahya Uddin
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

MySQL, смешивающий Damerau – Levenshtein Fuzzy с Like Wildcard

Я недавно реализовал UDF Damerau -Алгоритмы Левенштейна в MySQL, и было интересно, если есть способ объединить нечеткое соответствие Damerau -Алгоритм Левенш...

Задан 10 Jan 2013, 14:39 от user1236443
  • 37 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Вы должны вызывать traverseTrie только один раз, потому что внутри traverseTrie вы уже перебираете все слово. Код должен быть только следующим:

ЛЕНИЕ 3Готово. Ниже приведен код, который наконец прошел все мои тесты. Опять же, это смоделировано после модифицированной версии алгоритма Стива Ханова Мурило Васконсело. Спасибо всем, что помогло! /** * Computes the minimum Levenshtein ...

Задан 01 Feb 2011, 23:01 от Hristo
  • 5 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

сходство двух целых текстов с использованием расстояния Левенштейна [закрыто]

У меня есть два текстовых файла, которые я хотел бы сравнить. Что я сделал, это: Я разделил их обоих на предложения.Я измерил расстояние Левенштейна между каждым из предложений из одного файла с каждым из предложений из второго файла.Я хотел бы ...

Задан 25 Mar 2013, 10:17 от user2207055
  • 3 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Нахождение ближайшего соседа с использованием оптимизированного алгоритма Левенштейна

Я недавноопубликовал вопрос об оптимизации алгоритма для вычисления расстояния Левенштейна, и ответы привели меня к статье в Википедии оРасстояние Левенштейн...

Задан 07 Jul 2010, 13:41 от efficiencyIsBliss
  • 7 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Модификация алгоритма расстояния Левенштейна, чтобы не вычислять все расстояния

Я работаю над реализацией нечеткого поиска, и как часть реализации мы используем Apache StringUtils.getLevenshteinDistance. На данный момент мы рассчитываем ...

Задан 05 Oct 2010, 17:43 от AHungerArtist
  • 6 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Я думаю, что SparseArray можно использовать для DA, поэтому нет необходимости знать точный размер алфавита.

у здесь и программирую некоторые алгоритмы для моей основной программы на Java (ну, пока первый). Я запрограммировал алгоритм Левенштейна очень хорошо благодаря тому, что вики так хороша с псевдокодом для новичков плюс хороший учебник: D Затем я ...

Задан 17 May 2011, 15:54 от N00programmer
  • 29 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Кластеризация текста с расстояниями Левенштейна

У меня есть набор (2k - 4k) небольших строк (3-6 символов), и я хочу их кластеризовать. Поскольку я использую строки, предыдущие ответы наКак работает кластеризация (особенно кластеризация ...

Задан 02 Feb 2014, 14:38 от Alexandros
  • 5 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

R: Нечеткое совпадение строк с использованием jarowinkler

У меня есть два вектора типа символа в R.Я хочу иметь возможность сравнивать список ссылок со списком необработанных символов, используя jarowinkler, и назна...

Задан 17 Mar 2015, 14:45 от John Smith
  • 8 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как настроить SOLR для использования приближенного сопоставления строк Левенштейна?

Предоставляет ли поисковая система Apache Solr приблизительные совпадения строк, например, с помощью алгоритма Левенштейна? Я ищу способ найти клиентов по фамилии. Но я не могу гарантировать правильность названий. Как я могу настроить SOLR так, ...

Задан 17 Nov 2009, 22:24 от prinzdezibel
  • 35 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как сравнить практически похожие строки в Java? (Измерение расстояния строки) [закрыто]

Я хотел бы сравнить две строки и получить оценку, насколько они похожи. Например«Предложение почти похоже» а также«Предложение похоже». Я не знаком с существующими методами в Java, но для PHP я знаюфункция Левенштейна ...

Задан 18 Jan 2010, 08:38 от hsmit
  • 6 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Получить наименование ближайшего цвета в зависимости от шестнадцатеричного цвета

Я пытаюсь получить наиболее подходящее название цвета в зависимости от заданного шестнадцатеричного значения. Например, если у нас есть шестнадцатеричный цвет

Задан 18 Jun 2013, 15:53 от yckart
  • 22 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Наиболее эффективный способ расчета расстояния Левенштейна

Я только что реализовал алгоритм поиска файла наилучшего совпадения, чтобы найти наиболее близкое совпадение со строкой в ​​словаре. После профилирования мое...

Задан 06 Jul 2010, 02:27 от efficiencyIsBliss
  • 3 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как исправить ошибки в этой реализации Дамерау-Левенштейна?

Я вернулся с еще одним длинным вопросом. Поэкспериментировав с рядом реализаций расстояния Дамерау-Левенштейна на основе Python,Я наконец нашел тот, что указ...

Задан 07 Aug 2010, 20:29 от flow
  • 6 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Получить наименование ближайшего цвета в зависимости от шестнадцатеричного цвета

Я пытаюсь получить наиболее подходящее название цвета в зависимости от заданного шестнадцатеричного значения. Например, если у нас есть шестнадцатеричный цвет#f00 мы должны получить имя цветаred. '#ff0000' => 'red' '#000000' => 'black' '#ffff00' ...

Задан 18 Jun 2013, 17:53 от yckart
  • 18 голосов
  • 10 ответов
  • 0 просмотров
10 ответов

Онлайн-сервис использует таблицы поиска для хранения синонимов, а также истории сопоставления вручную. Это позволяет улучшить автоматизацию сопоставления данных при следующем импорте новых данных.

ужно автоматически сопоставить названия продуктов (камеры, ноутбуки, телевизоры и т. Д.), Которые поступают из разных источников, с каноническим именем в базе данных. Например"Canon PowerShot a20IS", "НОВЫЙ PowerShot A20 IS от Canon"а ...

Задан 27 Feb 2009, 15:37 от Ash
  • 31 голос
  • 0 ответов
  • 0 просмотров
0 ответов

http://www.artfulsoftware.com/infotree/queries.php?&bw=1280#552

$word = strtolower($_GET['term']); $lev = 0; $q = mysql_query("SELECT `term` FROM `words`"); while($r = mysql_fetch_assoc($q)) { $r['term'] = strtolower($r['term']); $lev = levenshtein($word, $r['term']); if($lev >= 0 && $lev < 5) { $word = ...

Задан 12 Jan 2011, 16:43 от user317005
  • 14 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как работают diff / patch и насколько они безопасны?

Относительно того, как они работают, мне было интересно работать на низком уровне:Что вызовет конфликт слияния?Используется ли контекст также инструментами д...

Задан 05 Nov 2015, 13:20 от cenouro
  • 41 голос
  • 0 ответов
  • 0 просмотров
0 ответов

Показатели сходства строк в Python

Я хочу найти сходство строк между двумя строками.это На странице приведены примеры некоторых из них. Python имеет реализациюАлгоритм Левенштейна, Есть ли луч...

Задан 24 Sep 2009, 09:43 от agiliq
  • 8 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как преобразовать меру сходства в меру разницы (расстояния)?

Есть ли общий способ преобразования между мерой сходства и мерой расстояния?Рассмотрим меру сходства, например, количество 2 граммов, которые имеют две строки.

Задан 31 Oct 2010, 19:06 от 135498
  • 8 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как вычислить сходство частот букв?

Учитывая эти данные (относительная частота букв на обоих языках): spanish => 'e' => 13.72, 'a' => 11.72, 'o' => 8.44, 's' => 7.20, 'n' => 6.83, english => 'e' => 12.60, 't' => 9.37, 'a' => 8.34, 'o' => 7.70, 'n' => 6.80,А затем вычисление ...

Задан 29 Mar 2013, 19:38 от Matías Insaurralde
  • 5 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Я не проверял это, это просто идея.

аюсь найти самый быстрый способ поиска предложений. Сначала я думал, что функция UDF Левенштейна в сочетании с таблицей mysql сделает эту работу. Но используя levenshtein, mysql должен был бы пройтись по каждой строке таблицы (тонны слов), что ...

Задан 14 Feb 2011, 20:13 от stormbreaker
  • 5 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

@ GökhanSever Да, смотрите связанную страницу.

у запустить Levenshtein, но ПУТЬ быстрее, потому что я создаю приложение в реальном времени. Это может закончиться, как только расстояние больше 10.

Задан 30 May 2011, 16:34 от Shamoon
  • 2 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Алгоритм расстояния Дамерау – Левенштейна в MySQL как функция

Кто-нибудь знает о реализации MySQL алгоритма расстояния Дамерау – Левенштейна как хранимой процедуры / функции, которая принимает одну указанную строку в качестве параметра и ищет нечеткие совпадения строки в определенном поле в конкретной ...

Задан 09 Jan 2013, 10:14 от user1236443
  • 19 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Вот

ликую это в духе ответа на ваши собственные вопросы. У меня был вопрос: как я могу реализовать алгоритм Левенштейна для вычисления расстояния редактирования между двумя строками, какописано ...

Задан 10 Sep 2008, 17:38 от JosephStyons
  • 4 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как использовать функцию расстояния Левенштейна в предложении sqlite where?

Я пытаюсь реализовать "Вы имели в виду?" своего рода функция для поиска. Я пытаюсь сделать запрос, который использует функцию Левенштейна, которая была написана на ruby. Мне было интересно, как я мог бы использовать эту функцию в запросе ...

Задан 18 Dec 2012, 07:32 от areke
  • 28 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как добавить функцию Левенштейна в MySQL?

Я получил код для расстояния Левенштейна для формы MySQL &quot;http://kristiannissen.wordpress.com/2010/07/08/mysql-levenshtein/» но, как добавить эту функци...

Задан 17 Dec 2012, 06:19 от Sandesh Sharma
  • 10 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

он воспроизводит ваш вывод, я думаю, вам нужно будет выбрать критерии частичного соответствия, я сохранил стандартные значения

ойкаУ меня есть данные о людях и именах их родителей, и я хочу найти братьев и сестер (людей с одинаковыми именами родителей). pdata<-data.frame(parents_name=c("peter pan + marta steward", "pieter pan + marta steward", "armin dolgner + jane ...

Задан 02 Jan 2018, 08:59 от sheß
  • 12 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Альтернатива Левенштейну и Триграмме

Скажем, у меня есть две следующие строки в моей базе данных: (1) 'Levi Watkins Learning Center - Alabama State University' (2) 'ETH Library' Мое программное обеспечение получает произвольные текстовые входные данные от источника данных, и оно ...

Задан 23 Nov 2013, 13:28 от cheeesus
  • 41 голос
  • 6 ответов
  • 0 просмотров
6 ответов

Показатели сходства строк в Python

Я хочу найти сходство строк между двумя строками.Этот [http://en.wikipedia.org/wiki/Category:String_similarity_measures]На странице приведены примеры некоторых из них. Python имеет реализациюАлгоритм ...

Задан 24 Sep 2009, 11:43 от agiliq
  • 5 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

сходство двух целых текстов с использованием расстояния Левенштейна [закрыто]

У меня есть два текстовых файла, которые яхотел бы сравнить. То, что я сделал, это: яЯ разделил их на предложения.мы измерили левенштейновское расстояние меж...

Задан 25 Mar 2013, 09:17 от user2207055
  • 4 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как использовать функцию расстояния Левенштейна в предложении sqlite where?

я пытаюсь реализовать &quot;Ты имел ввиду?&quot; своего рода функция для поиска.Я пытаюсь сделать запрос, который использует функцию Левенштейна, которая был...

Задан 18 Dec 2012, 06:32 от areke
  • 51 голос
  • 0 ответов
  • 0 просмотров
0 ответов

? Алгоритм Левенштейна чувствителен к регистру. В этом-то и дело.

я есть лист Excel с данными, по которым я хочу получить расстояние Левенштейна между ними. Я уже пытался экспортировать как текст, читать из скрипта (php), з...

Задан 22 Nov 2010, 06:58 от Yousf
  • 6 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Вы даже можете смоделировать это в MySQL, используя полнотекстовое индексирование, но вам нужно собирать слова из всех ваших документов, преобразовывать их в ngram, создавать полнотекстовые индексы на них и собирать их все вместе для быстрого поиска. Что приводит к всевозможным проблемам с избыточностью, синхронизацией ... не стоит вашего времени.

я большой набор запросов, и я использую levenshtein для вычисления опечаток, теперь levenshtein заставляет mysql занимать все время процессора. Мой запрос - полнотекстовый поиск + levenshtein в операторе UNION. sql1 - мой текущий запрос, sql2 - ...

Задан 29 Jan 2011, 04:10 от renevdkooi
  • 25 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Быстрое расстояние Левенштейна в R?

Существует ли пакет, содержащий функцию подсчета расстояний Левенштейна, которая реализована в виде кода на языке Си или Фортрана? У меня есть много строк дл...

Задан 05 Jul 2010, 20:50 от mbq
Page 1 of 2
1 2