Вопрос по – Рецепт Google Refine для приведения беспорядочных сущностей в две базы данных

3

У меня есть две базы данных грязных имен, таких как эти:

Jindal, Bobby Fla. Gov. Bobby Jindal Bobby Jindal 3M Corp. 3M Menomonie

Мне нужно найти спички. Может кто-нибудь указать мне или предложить хороший рецепт, как это сделать в Google Refine?

Эта ссылка дает мне отправную точку, но я мог бы использовать следующий совет: http://blog.ouseful.info/2011/05/06/merging-datesets-with-common-columns-in-google-refine/

Ваш Ответ

2   ответа
2

расширениесмотрите особенносверка часть док.

1

она будет соответствовать только в том случае, если ваши две ячейки идентичны. Если вы хотите использовать этот метод, вам нужно будет многократно кластеризовать и очистить данные.

Я поддерживаю Майкла ответ. Попробуйте воспользоваться услугой согласования: rdf one или theоткрыть примирить.

Похожие вопросы