Traducir texto de un idioma a otro.

Traducción automática respaldada por modelos Hugging Face en el motor de búsqueda Txtai (AI). Un texto original de David Mezzeti, traducido aquí a Español.

traducción automáticatraducir textotxtai
5 mayo, 2021 TXTAI, motor de búsqueda AI
5 mayo, 2021 TXTAI, motor de búsqueda AI

Dentro de las muchas traducciones de informática que realizamos para nuestros clientes, hemos querido traducir de Inglés a Español esta Guía de traducción automática de textos para Txtai, un interesante motor de búsqueda basado en inteligencia artificial (AI).

Texto original de David Mezzeti, fundador de la empresa «NeuML».

***

TUTORIALES SOBRE TXTAI (14 capítulos)

  1. Tutoriales sobre txtai
  2. Construir un índice Embeddings con conjuntos de datos de Hugging Face
  3. Construir un índice Embeddings a partir de una fuente de datos
  4. Añadir búsqueda semántica a Elasticsearch
  5. Control de calidad extractivo con txtai
  6. Control de calidad extractivo con Elasticsearch
  7. Aplicar etiquetas con clasificación de disparo cero
  8. Galería de la API de txtai
  9. Creación de resúmenes de texto abstracto
  10. Extraer texto de documentos
  11. Transcribir audio a texto
  12. Traducir texto de un idioma a otro
  13. Búsqueda por similitud con imágenes
  14. Ejecutar flujos de trabajo

Este artículo forma parte de una serie de tutoriales sobre txtai, un motor de búsqueda con tecnología de IA.

Este artículo trata sobre traducción automática respaldada por modelos Hugging Face. La calidad de la traducción automática a través de los servicios en la nube ha avanzado mucho y produce resultados de gran calidad. Este artículo muestra cómo los modelos Hugging Face ofrecen a los desarrolladores una alternativa razonable para la traducción automática local.

Instalar dependencias

Instalar txtai y todas las dependencias.

pip install txtai

Crear una instancia de traducción

La instancia de traducción es el principal punto de entrada para la traducción de texto entre idiomas. La canalización abstrae la traducción del texto en una llamada de una línea.

La canalización tiene una lógica para detectar el idioma de entrada, cargar el modelo pertinente que se encarga de la traducción del idioma de origen al de destino y devolver los resultados. El proceso de traducción también tiene una lógica integrada para dividir grandes bloques de texto en secciones más pequeñas que los modelos puedan manejar.

from txtai.pipeline import Translation

# Create translation model
translate = Translation()

Traducir texto

El siguiente ejemplo muestra cómo traducir un texto del inglés al español. Este texto se vuelve a traducir al inglés.

translation = translate("This is a test translation into Spanish", "es")
translation
Esta es una traducción de prueba al español
translate(translation, "en")
This is a test translation into Spanish

Traducir varios idiomas a la vez

La siguiente sección traduce una frase de inglés a 5 idiomas diferentes. Los resultados se pasan a una única llamada de traducción para que se traduzcan al inglés. La canalización detecta cada idioma de entrada y es capaz de cargar los modelos de traducción pertinentes.

languages = ["fr", "es", "de", "hi", "ja"]

translations = [translate("The sky is blue, the stars are far", language) for language in languages]

english = translate(translations, "en")

for x, text in enumerate(translations):
  print("Original Language: %s" % languages[x])
  print("Translation: %s" % text)
  print("Back to English: %s" % english[x])
  print()
Original Language: fr
Translation: Le ciel est bleu, les étoiles sont loin
Back to English: The sky is blue, the stars are far away

Original Language: es
Translation: El cielo es azul, las estrellas están lejos.
Back to English: The sky is blue, the stars are far away.

Original Language: de
Translation: Der Himmel ist blau, die Sterne sind weit
Back to English: The sky is blue, the stars are wide

Original Language: hi
Translation: आकाश नीला है, तारे दूर हैं
Back to English: Sky is blue, stars are away

Original Language: ja
Translation: 天は青い、星は遠い。
Back to English: The heavens are blue and the stars are far away.

La calidad de la traducción es, en general, muy alta. La traducción automática ha dado pasos de gigante en los últimos dos años. Estos modelos ofrecen a los desarrolladores una sólida alternativa a los servicios de traducción en la nube si se prefiere traducir en servidores locales.

Rate this post

Articulos relacionados


Traducción de un artículo e Risa Fujii sobre traduccion e internacionalizacion de sitios web y apps basadas en Rails: "The Basics of Rails I18n - Translate errors, models, and attributes". Cómo traducir mensajes de error, modelos, atributos, etc. Un articulo de Risa Fujii publicado en...

Traducción a Español de un artículo en Inglés de Ushmi Dave explicando cómo localizar / internacionalizar / traducir aplicaciones en Angular, usando RxWeb