Microsoft NMT Tradutor Microsoft Bing neural tradução de máquina detalhada

Microsoft NMT Tradutor Microsoft Bing neural tradução de máquina detalhada
Neural tradução automática (NMT) É o uso da inteligência artificial, de alta qualidade da tradução de máquina para o novo padrão。 Ele substituiu o velho estilo de tradução automática estatística (SMT) Tecnologia,A tecnologia no 2010-2020 A meados de anos, chegou a uma qualidade de pico。
Com SMT comparada,NMT pode não só da tradução original índice de qualidade de posição para fornecer uma tradução melhor,E os sons mais suaves、Mais semelhantes aos humanos。 Esta fluência a principal razão é que o NMT usa uma frase do contexto completo para traduzir a palavra。 SMT basta considerar cada uma das palavras na frente e atrás de algumas palavras em contexto directo。
O NMT modelo é a API do núcleo,Invisível para o usuário final。 A única diferença óbvia é a melhoria da qualidade da tradução,Especialmente para os Chineses、O japonês e o árabe e outras línguas。
O que é tradução de máquina?
A tradução de máquina do sistema é o uso de tecnologia de aprendizagem de máquina vai ser uma grande quantidade de texto a partir de qualquer um dos seus idiomas suportados na tradução do aplicativo ou serviços on-line。O serviço vai ser a"fonte"o texto é traduzido de uma língua para outra"destino"idioma。
Apesar de tradução automática tecnologia por trás do conceito e utilizar a interface é relativamente simples,Mas a ciência por trás e a tecnologia é extremamente complexo,E vários líderes de tecnologia,Especialmente aprendizado profundo(inteligência artificial),Big data,Idioma,A computação em nuvem e Web API。
A partir de 2010, desde o início da,Uma nova tecnologia de inteligência artificial,Que é a profundidade da rede neural também conhecido como aprendizado profundo),Para tornar a tecnologia de reconhecimento de voz atingiu o nível de qualidade,Para que o Microsoft Translator equipe, Reconhecimento de Voz e outras núcleo de tradução de texto de tecnologia combinado com,Para Começar A Tecnologia De Reconhecimento De Voz。Uma nova tecnologia de tradução de voz。
História,A indústria de utilização das principais técnicas de aprendizado de máquina é de tradução automática estatística(SMT)。Dado várias palavras no contexto do caso,SMT utiliza avançadas técnicas de análise estatística para estimar as palavras que o melhor efeito de conversão。A partir de meados da década de 2000 começou a,Incluindo a Microsoft, incluindo todos os grandes fornecedores de conversão estão usando SMT。
Neural tradução de máquina(NMT)aparece para causar uma tradução de a arte da mudança fundamental,Para trazer uma maior qualidade de tradução。Esta tradução tecnologia tem sido no segundo semestre de 2016 iniciar para usuários e desenvolvedores para implementar 。
SMT NMT e técnicas de tradução têm duas coisas em comum:
  • Ambos exigem um monte de pré-humano, a tradução do conteúdo para milhões e milhões de frases traduzidas para o sistema de formação。
  • Ambos não agir como um dicionário bilíngüe,Mas de acordo com uma possível lista de tradução para traduzir palavras,Mas, de acordo com a frase usando a palavra de contexto a ser traduzido。
O que é o Microsoft Translator tradução para?
Como API parte da coleção,Microsoft Translator tradução para o Texto de API e serviços de Fala da Microsoft é o Microsoft serviço de tradução automática。
Microsoft Translator tradução
Desde 2007,A equipe da Microsoft tem sido o uso do Microsoft Translator API,Desde 2011,Ele tem sido usado como um cliente voltado para a API para usar。MicrosoftTranslator Texto API no Microsoft interno tem sido amplamente utilizado。Ele é integrado a localização de produtos,Suporte a equipe de comunicação on-line。Pode ser também a partir familiarizado produtos。
A Microsoft Translator pode ser em qualquer plataforma de hardware na Web ou no aplicativo cliente, bem como com qualquer sistema operacional para uso com,Para realizar a tradução de linguagem e outra linguagem de operações relacionadas com a,Por exemplo, detecção de idioma,Texto-para-fala ou dicionário。
O uso de padrão da indústria, a tecnologia REST,Os desenvolvedores serão fornecidas, com indicação do idioma de destino dos parâmetros do texto de origem ou para o discurso de tradução de áudio enviados para o serviço,Em seguida, o serviço irá ser traduzido de texto é enviada de volta para o cliente ou aplicativo Web para usar。
A Microsoft Translator Serviço é hospedado em um Centro de Dados do Microsoft no Azure service,E de outros serviços de nuvem da Microsoft, também, obter a segurança de,Escalabilidade,A confiabilidade e a disponibilidade ininterrupta dos benefícios。
Microsoft Tradutor de voz traduzir
Microsoft Tradutor de voz de tradução tecnologia da Skype, o Tradutor começa no final de 2014, o lançamento,Desde o início de 2016, para iniciar como uma API aberta para a utilização do cliente。Ele foi integrado com o Microsoft Translator função de tempo real,O Skype,Skype Reunião de Difusão e para o Android Microsoft Translator app,o iOS e o Windows。
Fala tradução está agora disponível através do Microsoft Speech chegar,Voz da Microsoft é totalmente personalizável end-to-end service,Para o reconhecimento de fala,Voz tradutor e TTS (de texto para fala)。
Texto de tradução como funciona?
A tradução do texto, principalmente, técnicas, existem dois:As técnicas tradicionais,Tradução automática estatística(SMT) e tecnologia da próxima geração,Que neural de tradução automática (de NMT)。
Tradução automática estatística
Microsoft Translator tradução para alcançar a tradução automática estatística(SMT)compilação no Microsoft por mais de uma década de pesquisa de linguagem natural, com base。Uma tradução moderna do sistema em vez de escrever manual de regras entre os idiomas a ser traduzido,Mas a tradução será considerado como de humanos existentes tradução de aprendizagem de línguas entre a conversão de texto e a utilização da aplicação de estatística e aprendizado de máquina o progresso recente no problema。
O chamado"parallel Corpus", em grande parte, serve como uma moderna da Pedra de Rosetta,No contexto de muitos pares de idiomas e campos para fornecer uma palavra,Frases e expressões idiomáticas de tradução。Estatística técnicas de modelagem e algoritmos eficientes que podem ajudar a computadores para resolver descriptografados de detecção de dados de treinamento na língua fonte e a língua-alvo entre a relação correspondente código de reconciliação para encontrar uma nova entrada de frase, a melhor tradução perguntas。A Microsoft Translator métodos estatísticos com informações lingüísticas juntos,Para produzir melhor generalização e leva a compreender mais facilmente a tradução do Modelo。
Uma vez que este método não depende de dicionário ou gramática normativa,Portanto, ele fornece a frase, a melhor tradução,Em uma palavra usar todo o contexto, em vez de tentar realizar uma única palavra tradução。Para a tradução,Desenvolveu um dicionário bilíngüe。
Neural tradução automática
Melhoria contínua de tradução é muito importante。Mas,Desde 2010 anos, desde meados da,Tecnologia de SMT, a melhoria de desempenho foi em um estado estável。Através do uso do Microsoft AI super computador, especialmente Microsoft Cognitivo Toolkit de escala e função,Microsoft Translator oferece agora baseado em rede neural(tradução LSTM,Para que a tradução de melhoria de qualidade para a nova década。
Estes modelos de rede neural estão disponíveis através do Microsoft Speech e usar o ID da categoria de Texto API para todos linguagem de voz。
Com o tradicional SMT comparada,Rede Neural para converter a forma de implementação é fundamentalmente diferente。
A animação a seguir mostra a rede neural de tradução para traduzir a frase, a experiência de cada etapa。Desde que usando este método,A tradução irá colocar toda a frase em contexto,Em vez de o SMT técnicas usando apenas algumas palavras de janela deslizante,E vai produzir mais fluente e tradução humana de tradução。
Baseado na rede neural de formação,Cada uma das palavras ao longo do 500-dimensional vetor de uma codificação,O vetor de representação específica de pares de idioma, como o inglês e o Chinês e as suas características únicas。Baseado no utilizado de treinamento de idiomas para,A rede neural irá personalizar estas dimensões devem ser o que。Eles podem ser de codificação de alguns conceitos simples,Por exemplo, o género feminino,Homens,Neutro),A cortesia grau de a linguagem s,Sinta-se livre para,Escrito,Formulário, etc.,Tipo de palavras: verbo,Substantivo, etc.,Assim como qualquer outro não-óbvia de recursos a partir de dados de treinamento derivadas。
A rede neural de tradução da experiência das etapas são as seguintes:
  • Cada palavra,Ou, mais precisamente, manifestou o seu 500-dimensional vetor,Tudo através do"neurônios da primeira camada,Ele vai em uma frase em outra palavra, a palavra de um contexto 1000-dimensional vetor b na codificação。
  • Uma vez que todas as palavras, uma vez codificado para estes 1000-dimensional vetor no,Este processo irá repetir-se várias vezes,Cada camada pode ser em uma frase completa, no contexto de melhor ajuste fino as palavras 1000-dimensional representação com tecnologia SMT, pelo contrário, só se pode considerar de 3 a 5 janela do Word
  • Em seguida,,Note que a camada, por exemplo, o software de algoritmo irá utilizar o resultado final da matriz,A atenção que a camada de usar esse final de saída na matriz e traduzidas anteriormente palavra de saída para definir o próximo deve traduzir a fonte da frase em que a palavra。Ele também irá usar estes cálculos potencialmente descartar a língua-alvo em palavras desnecessárias。
  • Decodificador camada de conversão a seu destino apropriado idioma idioma equivalente a tradução da palavra selecionada, ou, mais especificamente,,Em pleno contexto da frase indica que as palavras de 1000-dimensional vetor。E, em seguida, a última camada é a saída de feedback para a camada em causa,Para calcular a correspondente tradução da fonte da frase em que a palavra seguinte。

A animação mostra o exemplo,Context-aware 1000-modelo dimensional" a "será codificado como um substantivo casa é um francês la maison em mulheres do word。Isso permitirá a correta tradução de" "É" puxar "em vez de" música "é singular,Do sexo masculino, ou" LES "é plural, uma vez que alcançar o decodificador camada de tradução。
Note que o algoritmo também será com base no anteriormente palavra traduzida no presente caso," a ", calculado a,Ao lado a tradução da palavra deve ser o tema da" casa "em vez de o adjetivo" azul ") 。A razão deste objetivo pode ser alcançado,Porque o sistema entende inglês e francês será de cabeça para baixo estas palavras em frases em ordem。Você também pode calcular o,Se o adjetivo é" grande "em vez de cor,Ele não deve inverter" a casa grande " =>"la grande maison", um。
Devido ao uso deste método,Na maioria dos casos,O resultado final relação de SMT de tradução com base em mais liso,Mais perto de tradução humana。
Voz de tradução como funciona?
Microsoft Translator também é capaz de converter voz。A tecnologia em que o tradutor em tempo real função,O Tradutor aplicação,Skype Tradutor divulgada,E, inicialmente, só via Skype Tradutor recurso, bem como no iOS e Android no Microsoft Translator app fornecer essa funcionalidade。Agora os desenvolvedores podem usar o portal Azure fornece a versão mais recente do RESTO baseado em API aberta para o desenvolvimento。
Embora à primeira vista a partir da arte anterior sobre a base de construção de um discurso de tradução tecnologia parece ser um processo simples,Mas ele precisa ser feito do que o existente"tradicional"homem-máquina motor de reconhecimento de voz é simplesmente inserido no texto existente em um muito mais。A tradução de um。
A fim de ser a"fonte"de voz de um idioma é corretamente traduzido para o outro"alvo"idioma,O sistema precisa passar por quatro etapas。
  • Reconhecimento de fala,Converter áudio para texto
  • TrueText:Uma tecnologia da Microsoft,Pode normalizar o texto para torná-lo mais adequado para a tradução
  • Pelo texto do motor de tradução para tradução,Mas o uso do projetado especialmente para a vida real diálogo falado, o desenvolvimento da tradução do modelo
  • Se necessário, texto-para-fala de conversão,Para gerar traduzido áudio。

Reconhecimento automático de fala ASR)
Usando a rede neural treinada(NN)sistema para realizar o reconhecimento automático de fala ASR),O sistema pode analisar milhares de horas de entrada de áudio de voz。O modelo é baseado na interação entre as pessoas e não as pessoas com máquina de comandos para a formação,Assim, para gerar um diálogo regular otimizado para o reconhecimento de fala。Para atingir este,Com o tradicional homem-máquina ASR comparada,Precisa de mais dados e maior DNN。
TrueText
Quando os seres humanos com outros seres humanos, quando se comunicam,Nosso discurso não é como nós geralmente achamos que é perfeito,Claro ou puro。Por meio da tecnologia TrueText,Eliminando a voz diferença no preenchimento palavra como" um","ah","e,","como",gagueja e se repete。Adicionando um período de,De boa pontuação e letras maiúsculas,Você também pode melhorar a capacidade de leitura de texto e tradução de。Para obter estes resultados,Usando décadas de tecnologia de idiomas de trabalho,Este é o Tradutor desenvolvido,Usado para criar TrueText。A figura a seguir através de um exemplo real para descrever o TrueText para uma variedade de conversão para a padronização deste texto。

Deixe um Comentário