Pergunta sobre asp.net-web-api – API da Web do Google N-Gram [fechada]

21

Eu gostaria de usar o Google 2-grams para o meu projeto; mas o tamanho dos dados torna a pesquisa cara em termos de velocidade e armazenamento.
Existe uma API da Web disponível para esse fim (em qualquer idioma)? O sitehttp://books.google.com/ngrams/graph renderiza uma imagem, posso obter valores de dados?

Sua resposta

2   a resposta
8

Microsoft Web N-Gram

Ele pode ser consultado de diferentes maneiras, incluindo uma chamada GET direta através doInterface REST. Por exemplo, ligando para o URL:

http://weblm.research.microsoft.com/weblm/rest.svc/bing-body/apr10/1/jp?u={YOUR_TOKEN}&p=red+panda

devolve

-9.005

qual é a probabilidade de log da frasered panda.

Além disso, é mais prático do que o Google N-Grams, pois, para uma frase dada, ela não produz simplesmente sua freqüência absoluta, mas pode produzir sua probabilidade conjunta, probabilidade condicional e até mesmo as palavras mais prováveis ​​que se seguem.

Disclaimer: Eu não sou um funcionário da Microsoft, eu simplesmente acho que acabei de encontrar um serviço incrível.

Hmmm O web-ngram.research.microsoft.com demorou muito para responder. Michiel de Mare
Acabei de solicitar uma chave de API do MS. O único mecanismo oferecido para se registrar é enviar um email. Parece-me que não há registro automatizado para o serviço da Microsoft. knb
Isso é verdade. Eu também achei que uma escolha estranha. Alphaaa
13

Google BigQuery
Nesse caso, os trigramas estão disponíveis em domínio público. UsandoAcesso à linha de comando fez o trabalho para mim.

Outra alternativa é um serviço web chamadoPhraseFinder Martin Trenkmann
Como você chegou aos dados do ngram? Não consegui ver em conjuntos de dados de amostra! metdos
abrirbigquery.cloud.google.com/?pli=1, (e aceite os termos e condições e tudo o que ainda não foi feito e abra o link), em seguida, no painel do lado esquerdo, selecione "trigramas" em "publicdata: samples" Five

Perguntas relacionadas