¿Cómo contar las palabras de una web, para enviarla a traducir?

Contar las palabras de una web es clave para saber cuánto costará traducirla. Descubre aquí 5 opciones para lograrlo: desde el clásico copiar a word hasta cómo contar palabras en archivos html, php, po, BBDD de contenidos, plugins para Wordpress, aplicaciones online, etc

21 marzo, 2020 Contar las palabras de una web es el primer paso para traducirla
21 marzo, 2020 Contar las palabras de una web es el primer paso para traducirla

Traducir una web exige contar palabras

Casi todas las empresas, antes o después, se plantear traducir su web. Es lógico. Una vez terminada la web en un idioma, basta con traducirla para abarcar nuevos mercados. Y el precio de traducir una web es siempre pequeño, comparado con los potenciales beneficios en términos de nuevos clientes. Sin embargo, traducir una web e incluso saber cuánto podría costar, exige un paso previo que en ocasiones puede ser algo trabajoso: contar el número de palabras a traducir.

Contar el número de palabras de una web es la única forma de averiguar cuánto va a costar traducirla. Es imprescindible, no hay otra opción. Para poder hacerte un presupuesto de traducción web, todo traductor o agencia de traducción necesitará saber el número de palabras: puedes decirles cuántas palabras tiene tu web, o enviarles los archivos a traducir. Pero cómo…? ¿Cómo contar las palabras de tu web? ¿Cómo exportar los contenidos para enviarlos a traducir?

¿Cuántas palabras tiene mi web?

Contar el número de palabras de una web no es fácil, ya que casi nunca se dispone de los archivos a traducidos extraídos en un zip y cada web es totalmente diferente, con lo que no hay una única forma de conseguirlo… En todo caso es fundamental tener en cuenta 3 aspectos:

  1. Tipología de la web. Hay webs estáticas programadas en Html, y webs dinámicas montadas sobre plataformas tipo CMS (como WordPress) o plataformas de eCommerce (Prestashop, Magento, etc).
  2. Tipología del contenido. Hay textos propios de la web en sí (descripcion de la empresa, de los productos…) y textos comunes, propios de la plataforma o de la tienda.

 

¿Cómo se puede saber cuántas palabras tiene una web?

Tipos de web

A nivel contenidos, debemos distinguir entre webs estáticas y webs dinámicas:

  • WEBS ESTÁTICAS. Son webs sencillas, no tienen detrás un CMS ni una BBDD: los contenidos son fijos, no cambian… Suelen estar programadas a mano, en Html o Php, sin recurrir a plataformas o frameworks. Los textos están integrados en archivos de código html/php, fácilmente localizables.
  • WEBS DINÁMICAS. Son webs más complejas, más potentes, más flexibles… Tienen detrás frameworks tipo CMS (WordPress, Joomla, Drupal) o eCommerce (Prestashop, Magento, etc). Los usuarios pueden fácilmente añadir o editar contenidos (artículos, posts, productos…). Los textos y taxonomías se almacenan en BBDD.

Tipos de texto

Una web tiene muchísimos tipos de texto diferentes, unos más evidentes / visibles que otros, todos guardados en sitios diversos y en formatos diversos. Es bueno entender la estructura de una web, conocer las diversas capas de textos y averiguar qué tipo de web es la tuya. Esto te ayudará a localizar todos los textos de tu web sin dejarte ninguno.

  • PLATAFORMA, TEMA Y PLUGINS. Las webs dinámicas tienen una base estructural, un andamiaje sobre el que se construye la web en sí. En una primera capa está la plataforma CMS o eCommerce: WordPress, Joomla, Drupal, Prestahop, Magento… Sobre ella, en una segunda capa, el tema o diseño escogido, y los plugins instalados. Estas capas incluyen textos breves muy orientados a usabilidad («atrás», «seguir», «enviar», «comprar», «ver siguiente»…), pero vienen ya traducidos, por lo que no necesitamos computarlos.
  • CONTENIDOS. Estos son los textos que tú has escrito: descripción de tus servicios, BBDD de productos, avisos personalizados, mensajes, alerts, etc. Si tu web es estática, todo esto estará en archivos Html, Php, JavaScripts y Ajax. Si tu web es dinámica, estará en bases de datos (BBDD). Sea como sea, éstos son los textos que debemos contar, extraer y enviar a traducir.

 

¿Cómo contar las palabras en WordPress?

WordPress ofrece información del número de palabras de cada post, pero sólo desde el panel de edición del post, pulsando el icono redondo «i» (información). Sin embargo, no ofrece estadísticas globales del numero de palabras de toda la web, ni mucho menos una tabla con todo el desglose de palabras por página / entrada… ¿Cómo ver de formal global las palabras de todos los post de tu web?

Plugins para contar palabras en WordPress

Si tienes WordPress existen algunos plugins específicos para contar palabras:

» WP WORDCOUNT. Plugin de pago, precio de 29 USD a 99 USD. Muy completo, pero no actualizado en los últimos 12 meses.
https://es.wordpress.org/plugins/wp-word-count/

» CH EASY WORDCOUNT. Plugin gratuito. Descontinuado desde 2020 (descarga no disponible).
https://wordpress.org/plugins/ch-easy-word-count/

» WP WORDCOUNT WIZARD. Plugin para contar palabras en WP. Fnciona muy bien. A dia de hoy es la única opción disponible totalmente gratis.
https://wordpress.org/plugins/word-count-wizard/

 

¿Cómo contar las palabras de una web?

Se puede contar las palabras de una web de distintas maneras, no hay ninguna mejor ni peor, todas son válidas. Escoge el método que mejor se adapte a cómo esté programada tu web (tal y como se indica más arriba): ¿es una web estática o dinámica? ¿es un WordPress? ¿es un eCommerce?

Básicamente hay 8 técnicas para contar palabras web (las explicamos más abajo):

  1. Copiar y pegar a mano los textos a Word
  2. Analizar los archivos de código HTML
  3. Buscar los archivos PO
  4. Exportar la base de datos de contenidos
  5. Usar plugins específicos
  6. Programas específicos
  7. Plataformas de localización
  8. Herramientas online

 

Extraer textos y contarlos en Word

Si tu web tiene pocas páginas, extraer los textos a mano y pegarlos en un Word puede ser una buena táctica: fácil, rápida y práctica. Lo importante es no dejarte ninguna página.

Es tan básico como parece: navega por tu web, selecciona todo el texto de una página, y haz «copiar» / «pegar» en Word (escoge «pegar sin formato», así evitarás que se te llene el Word de imágenes y formatos inútiles). Si tienes problemas, pega en un editor de texto plano tipo NotePad. Repite este proceso página a página hasta tener todos los textos web en Word.

Te aconsejamos maquetar un poco el Word, aunque te lleve un poco más de tiempo. Intenta identificar bien páginas, secciones y módulos: piensa que este Word es el que enviarás a traducir, y el que te enviarán traducido. Es importante que quede claro a qué corresponde cada texto, si no luego tu diseñador se volverá loco para volver a pegar todo en Html.

Lo mejor es extraer primero los elementos comunes a todas las páginas: el menú de navegación (a veces hay que transcribirlo manualmente), el header y el footer. Copialos una primera y única vez para no repetirlos. A partir de aquí, ve página a página: indica siempre la URL de origen, destaca en grande los títulos, haz pequeñas tablas para identificar elementos desplazados, etc.

Una vez lo tengas todo, el propio Word te indicará el número de palabras: mira en la barra inferior del programa, a la izquierda: número de páginas, número de caracteres y número de palabras. Voilà!

Word indica el número de palabras de cualquier texto

Pedir o descargar archivos HTML

Si tu web no tiene CMS, una buena opción para contar las palabras es conseguir los archivos de código Html o Php y procesarlos con algún software de etiquetas. Esta es una alternativa muy profesional, limpia y práctica. No sólo te servirá para contar palabras, sino que los traductores podrán usar estos mismos archivos, y traducir directamente sobre código, con la ventaja además de que podrán traducir todas las meta etiquetas.

Si tu web es HTML, lo tienes muy fácil: busca los archivos con esa extensión. Si tu web es .PHP, recuerda añadir los includes: header, nav, footer, etc.

Es fundamental no dejarte textos en archivos javascript, ajax, etc. Hay textos que suelen pasar desapercibidos, olvidados en archivos de programación: frases en headers y sliders, avisos de error tipo pop-up, validadores, mails automatizados, etc.

Para contar palabras en archivos de código (html, php, xml, js …) se pueden usar o bien programas profesionales de traducción (Trados, Passolo, Wordfast, MemoQ) o bien aplicaciones específicas para contar palabras, tanto gratuitas (Translator´s Abacus) como de pago (WebBudgetFinecount). Puede ser muy útil también la aplicación StripHTML, que extrae los textos dentro de código HTML eliminando todas las etiquetas…

StripHTML te permite extraer texto limpio eliminando etiquetas Html

Buscar archivos .po

Las webs mas internacionales usan archivos PO, archivos sólo texto basados en el framework GNU gettext. Es la mejor forma de gestionar muchos idiomas: si guardas todos los estilos en un CSS externo y todos los javascripts en un JS externo, por qué no sacar todos los textos a un .PO? Los desarrolladores usan gettext para generar un archivo POT con todos los textos y a partir del cual se pueden realizar las traducciones, en archivos .PO y .MO (compilado). Cada PO contiene un listado de IDs y sus textos correspondientes en ese idioma.

¿Cómo encontrar archivos .PO? Los .PO se guardan en la carpeta languages correspondiente, y tienen siempre un nombre que incida nombre del país e idioma: [nombre]-es_ES.po. Puedes navegar la estructura de archivos de la web o hacer una búsqueda por comandos en Google, en la web que te interese: «site:www.nombredelaweb.com filetype:po»

Para contar las palabras y editar un archivo PO puedes usar POEDIT o LOCO TRANSLATE. Ambos te ofrecen un recuento del número de palabras de tus archivos PO.

POEDIT ofrece estadisticas y recuento de palabras de archivos .po

Exportar la BBDD de contenidos

Todas las webs dinámicas almacenan sus contenidos en una base de datos (BBDD): es lo más habitual en el caso de webs con muchos productos. En estos casos no hay opción: contacta con tu informático y pídele que te exporte la BBDD de contenidos, explicándole que el objetivo es traducirla para que luego él la importe y genere una nueva versión traducida de la web.

Se puede exportar la BBDD en cualquier formato. Si tiene estilos (etiquetas html), sería mejor exportarla en XML, pero puede valer un TXT o un XLS. Para contar las palabras de un TXT, CSV o XLS, se puede usar Word.

Plugins de traducción

La mayoría de webs dinámicas aprovechan frameworks o plataformas comerciales que ofrecen multitud de funcionalidades, y sobre las que se puede desplegar un diseño personalizado. Es el caso de gestores de contenidos (CMS) como WordPress, Joomla o Drual, o tiendas virtuales (eCommerce) como Prestashop, Magento, etc. Para gestionar contenido multilingüe en estas plataformas, se suele recurrir a plugins multi-idioma.

Si tu web está en WordPress, los plugins de gestión de contenidos multilingüe más habituales son WPML, Polylang, Weglot, Translate Press, etc. No son plugins sencillos, en ocasiones llegan a ser bastante complejos, en función del tema o plantilla que esté usando la web. IMPORTANTE: estos plugins lo que hacen es convertir un sitio web en multilingüe, con todo lo que esto implica… No son gratuitos, son siempre de pago, y no son nada baratos!

Programas para contar palabras

Existen varios programas que permiten contar el número de palabras de una web de forma automatizada. Pero todos ellos tienen limitaciones o desventajas importantes… En general, todas las aplicaciones tradicionales, diseñadas para traducir páginas web y contar palabras de archivos web, están hoy obsoletas, desactualizadas, abandonadas por sus creadores: TransAbacus, WebBudget, FineCount, Catscraddle, Lingobit…

Plataformas de localización

En los últimos años han surgido grandes plataformas de localización, «crowsourced translation» o «collaborative translation», que procesan los contenidos de una web, los reformatean, los pretraducen con machine translation, y los hacen revisar online por una comunidad de traductores freelance. Crowdin, Memsource, Transifex, Unbabel, Gengo, Localize, SmartCat, Smartling, Protranslate, TextMaster, LIlt…

Estas plataformas son excelentes para traducir grandes volúmenes de textos en plazos cortos, ya que fragmentan los textos de una web y los reparten entre miles de traductores, pero la calidad y la coherencia dejan mucho que desear. Usarlas para contar palabras sería como matar moscas a cañonazos.

 

Vaya lío… demasiado complicado!

Efectivamente, contar con precisión el número de palabras de una web no es tarea fácil: requiere conocimientos técnicos, es laborioso, y es fácil equivocarse. Por eso el mejor consejo es dejar este trabajo en manos de profesionales, aunque si sigues leyendo averiguarás cómo obtener algún recuento aproximado de forma automática…

Contar las palabras de una web puede llegar a ser una pesadilla

 

Nuestro consejo para contar palabras

La mejor opción para contar palabras es que contactes con tu traductor o agencia y que sean ellos quienes realicen un análisis profesional de tu web, cuenten las palabras, extraigan los contenidos a traducir y te preparen un presupuesto de traducción web. No merece la pena que te compliques y acabes con recuentos que pueden ser inexactos o equívocos.

Lo ideal es que te indiquen el número total de palabras (con indicación del porcentaje de repeticiones, si las hay), y te detallen las palabras de cada sección, ya que igual puedes prescindir de traducir alguna cosa para reducir costes (un ejemplo habitual son las condiciones legales, que muchas veces no merece la pena traducir).

 

 

Presupuesto de traducción web

Ahora que ya sabes cuántas palabras tiene tu página web, ya puedes calcular cuánto costará traducir tu web. Basta con multiplicar el número de palabras, por la tarifa de traducción (las repeticiones suelen cobrarse al 50%). Tienes más detalles en ¿Cómo saber cuánto costará traducir mi web?. En todo caso esto será siempre aproximado, ya que será tu traductor o agencia quien te realice un análisis completo y te entregue un presupuesto formal de traducción web.

Una vez tengas el numero de palabras de tu web ya podrás tener presupuesto

Si necesitas traducir tu web, contacta con nosotros en el teléfono 93 268 40 85 (pregunta por Chema, nuestro experto en marketing, web y SEO). Te ayudaremos a plantear tu proyecto para reducir costes y asegurar que la traducción quede perfecta. Somos expertos en traducción web y contamos con experiencia en más de 100 proyectos de traducción web con éxito. ¿Empezamos…?

 

* * *

Más articulos sobre traducción de páginas web


PRECIO TRADUCCIÓN WEB

El precio de traducir una web depende del idioma y del número de palabras, pero también pueden influir otros factores como el formato de los archivos o textos, la dificultad...

CONTAR PALABRAS WEB

Contar las palabras de una web es clave para saber cuánto costará traducirla. Descubre aquí 5 opciones para lograrlo: desde el clásico copiar a word hasta cómo contar...

TRADUCIR WORDPRESS

Guía completa para traducir de forma profesional todos los textos de una web realizada en Wordpress. Actualizada 2020. ¿Cómo hacer que tu Wordpress sea multilingüe? ¿Qué...