Лучшие fuzzy-search вопросы ИТ разработчиков

  • 5 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Нечеткое слияние / совпадение Python Pandas с дубликатами

У меня есть 2 кадра данных, 1 для доноров и 1 для сборщиков средств. В идеале я пытаюсь найти, собирают ли пожертвования какие-либо пожертвования и если да, скопировать часть этой информации в мой набор данных по сбору средств (имя донора, ...

Задан 13 Nov 2013, 21:18 от Wizuriel
  • 5 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Q-грамма приближенного соответствия оптимизаций

У меня есть таблица, содержащая 3 миллиона записей о людях, по которым я хочу выполнить нечеткое сопоставление, используя q-граммы (например, по фамилии). Я создал таблицу из 2 граммов, ссылающихся на это, но производительность поиска на этом ...

Задан 21 Dec 2009, 07:28 от Peter
  • 3 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 (не ваша вина, просто кажется, что должен быть более чистый путь), это единственная рабочая реализация, которую я нашел. Спасибо!

ы получаете соответствующий нечеткий термин и его смещение при использовании Lucene Fuzzy Search? IndexSearcher mem = ....(some standard code) QueryParser parser = new QueryParser(Version.LUCENE_30, CONTENT_FIELD, analyzer); TopDocs topDocs ...

Задан 03 May 2011, 18:58 от user193116
  • 12 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как я могу создать индекс с pymongo [дубликат]

На этот вопрос уже есть ответ здесь:Рекомендуемый способ / место для создания индекса для коллекции MongoDB для веб-приложения 3 ответаЯ хочу включить тексто...

Задан 05 Nov 2015, 09:50 от Maximilian
  • 62 голосов
  • 10 ответов
  • 0 просмотров
10 ответов

Нечеткое сопоставление с использованием T-SQL

У меня есть столлицс личными данными и так далее. Есть много столбцов, но один из интересных здесь:addressindex, lastname а такжеfirstname гдеaddressindex это уникальный адрес, просверленный до двери квартиры. Так что, если у меня есть «как ...

Задан 28 May 2009, 16:52 от Frederik
  • 5 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Нечеткое слияние / совпадение Python Pandas с дубликатами

У меня есть 2 кадра данных, 1 для доноров и 1 для сборщиков средств. В идеале, что яЯ пытаюсь выяснить, делали ли какие-либо сборщики денег пожертвования, и ...

Задан 13 Nov 2013, 20:18 от Wizuriel
  • 11 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

SQL Fuzzy Matching

Надеюсь, я не повторяю этот вопрос. Я сделал поиск здесь и Google, прежде чем размещать здесь.Я работаю в электронном магазине с SQL Server 2008R2 с включенн...

Задан 19 Nov 2013, 05:11 от Jeyara
  • 14 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Solr Fuzzy Поиск похожих слов

Я пытаюсь сделать нечеткий поиск "jahngir" ~ 0.2, который не дает никаких результатов. В моих индексах есть записи с данными "JAHANGIR RAHMAN MD". Если я попробую поиск с точным словом "jahangir" ~ 0.2, это сработает. Может кто-нибудь, ...

Задан 27 Mar 2012, 03:50 от Ravi
  • 8 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Быстрый нечеткий / приблизительный поиск по словарю строк в Ruby

У меня есть словарь строк от 50K до 100K (может быть до 50+ символов), и я пытаюсь найти, находится ли данная строка в словаре с некоторым «редактированием» допуска на расстояние. (Левенштейн например). Я прекрасно предварительно вычисляю любой ...

Задан 16 Nov 2013, 00:10 от Nicolas M.
  • 2 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Нечеткое объединение SQL - MSSQL

У меня есть два набора данных. Существующие клиенты и потенциальные клиенты.Моя главная цель - выяснить, есть ли среди потенциальных клиентов уже существующи...

Задан 31 Aug 2016, 13:35 от hansolo
  • 5 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Какое самое простое приложение для поиска по сайту, которое поддерживает нечеткий поиск?

У меня есть сайт, по которому нужно искать записи по 20-30 тыс., В основном это названия фильмов и телешоу. Сайт запускает php / mysql с memcache.Я ищу заменить

Задан 14 Dec 2009, 06:34 от user15063
  • 17 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как сопоставить строки нечетких совпадений из двух наборов данных?

Я работал над способом объединения двух наборов данных, основанных на несовершенной строке, такой как название компании. В прошлом мне приходилось сопоставля...

Задан 16 Oct 2014, 13:37 от A L
  • 17 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Функция сходства в Postgres с pg_trgm

Я пытаюсь использовать функцию подобия в Postgres для нечеткого сопоставления текста, однако всякий раз, когда я пытаюсь использовать его, я получаю сообщени...

Задан 12 Feb 2010, 20:44 от Alex Gaynor
  • 7 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Нечеткий поиск в JavaScript

Я работаю над этим фильтром, где у меня около 50-100 пунктов списка. И у каждого элемента есть разметка вот так: <li> <input type="checkbox" name="services[]" value="service_id" /> <span class="name">Restaurant in NY</span> <span ...

Задан 09 Feb 2012, 05:49 от Ionuț Staicu
  • 38 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Алгоритм нечеткого поиска (алгоритм приблизительного сопоставления строк)

Я хочу создать алгоритм нечеткого поиска. Тем не менее, после нескольких часов исследований я действительно борюсь.Я хочу создать алгоритм, который выполняет...

Задан 01 Sep 2015, 16:58 от Yahya Uddin
  • 18 голосов
  • 10 ответов
  • 0 просмотров
10 ответов

Онлайн-сервис использует таблицы поиска для хранения синонимов, а также истории сопоставления вручную. Это позволяет улучшить автоматизацию сопоставления данных при следующем импорте новых данных.

ужно автоматически сопоставить названия продуктов (камеры, ноутбуки, телевизоры и т. Д.), Которые поступают из разных источников, с каноническим именем в базе данных. Например"Canon PowerShot a20IS", "НОВЫЙ PowerShot A20 IS от Canon"а ...

Задан 27 Feb 2009, 15:37 от Ash
  • 3 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

составление нечеткого регулярного выражения с регулярным выражением Python

Когда я узнал, что питонрегулярное выражение Модуль позволяет нечеткое сопоставление Я был все более счастлив, так как это казалось простым решением многих м...

Задан 14 Jan 2014, 12:13 от Jens-Konrad Preem
  • 65 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Нечеткий поиск в JavaScript, который имеет смысл

Я ищу библиотеку JavaScript нечеткого поиска для фильтрации массива. Я пытался использоватьfuzzyset.js а такжеfuse.js, но результаты ужасны (есть демоверсии,...

Задан 26 Apr 2014, 00:11 от willlma
  • 67 голосов
  • 8 ответов
  • 0 просмотров
8 ответов

Библиотека поиска нечетких строк в Java [закрыто]

Я ищу высокопроизводительную библиотеку Java для поиска нечетких строк.Существует множество алгоритмов для поиска похожих строк, расстояния Левенштейна, Dait...

Задан 29 Nov 2008, 13:17 от 4 revs, 3 users 63%
  • 5 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Q-грамма приближенного соответствия оптимизаций

У меня есть таблица, содержащая 3 миллиона записей о людях, по которым я хочу выполнить нечеткое сопоставление, используя q-граммы (например, по фамилии). Я ...

Задан 21 Dec 2009, 06:28 от Peter
  • 14 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

 для пользователя, чем Soundex.

сноэтот комментируя в связанной ветке, я хотел бы знать, почему методы, основанные на расстоянии Левенштейна, лучше, чем Soundex.

Задан 03 Sep 2008, 16:04 от ColinYounger
  • 8 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Примените нечеткое сопоставление к столбцу данных и сохраните результаты в новом столбце.

У меня есть два фрейма данных, каждый из которых имеет разное количество строк. Ниже пара строк из каждого набора данных

Задан 25 Jul 2016, 20:59 от Jstuff
  • 14 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Нечеткое совпадение строк в Python

У меня есть 2 списка из более чем миллиона имен с немного различными соглашениями об именах. Цель здесь - сопоставить те записи, которые похожи, с логикой 95...

Задан 16 Aug 2016, 07:52 от BernardL
  • 36 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Проверка нечеткой / приблизительной подстроки, существующей в более длинной строке, в Python?

Используя такие алгоритмы, как leveinstein (leveinstein или difflib), легко найти приблизительные совпадения. >>> import difflib >>> difflib.SequenceMatcher(None,"amazing","amaging").ratio() 0.8571428571428571Нечеткие совпадения могут быть ...

Задан 19 Jul 2013, 07:51 от DhruvPathak
  • 5 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Какое самое простое приложение для поиска по сайту, которое поддерживает нечеткий поиск?

У меня есть сайт, по которому нужно искать записи по 20-30 тыс., В основном это названия фильмов и телешоу. Сайт запускает php / mysql с memcache. Я ищу заменитьFULLTEXT с участиемsoundex() поиск, который у меня сейчас есть, который работает ... ...

Задан 14 Dec 2009, 07:34 от user15063
  • 8 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Быстрый нечеткий / приблизительный поиск по словарю строк в Ruby

У меня есть словарь строк от 50K до 100K (может быть до 50+ символов), и я пытаюсь найти, есть ли данная строка в словаре с некоторыми &quot;редактировать&qu...

Задан 15 Nov 2013, 23:10 от Nicolas M.
  • 13 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Объединение двух фреймов данных с использованием нечеткого / приблизительного сопоставления строк в R

ОПИСАНИЕУ меня есть два набора данных с информацией, которую мне нужно объединить. Единственные общие поля, которые у меня есть, это строки, которые не полно...

Задан 09 Feb 2010, 19:41 от Brandon Bertelsen