domingo, 22 de agosto de 2010

Cómo sacar textos japoneses de una imagen 知らない漢字を画像からの抜き方

Decíamos ayer...

Bueno, lo prometido es deuda y tras varios meses de parón injustificado y sin más dilación (no, no he estado en la cárcel, gracias), vamos al lío.

Leer o descubrir lo que significaba una palabra en una web quedamos en que era fácil. Seleccionar el texto con el ratón y con algo de ayuda... ¡Zas! Respuesta al instante.

¿Pero qué pasa con las imágenes?

¿Qué pasa si estás viendo una serie de animación japonesa tan tranquilo y te asalta algo como esto?


Evidentemente, el método anterior no sirve con las imágenes. Lamentablemente, por mucho que pases el puntero por el vídeo o selecciones la imagen en este blog, ni Rikai-chan ni Santa Tecla de Escape podrán aliviar tu sufrimiento.


どうもちゅみまちぇん。Rikaiちゃんがこんなのは理解できないのよ
( ·ω·)
Traducción: ¡Nooooooooooooooooooooooooooooo!
( ;Д;)

¿Entonces?

Pues hay un par de opciones:
  • Usar un programa de OCR que reconozca caracteres japoneses. No es mala idea, aunque si la caligrafía es mínimamente exótica, o el fondo no es suficientemente uniforme, no creo que funcione demasiado bien, por la experiencia que tengo con el alfabeto de toda la vida. De hecho, hasta ahora nunca se me había ocurrido probar algo así, y de hecho no tengo ninguno a mano.
  • Dibujar a mano los kanjis que nos interesen en un programa que reconozca la escritura a mano y nos proporcione su equivalente en texto.
Debido a que la primera opción es trivial y directa, además de que no he tenido la oportunidad de llevarla a cabo, no seguiré comentándola aquí. Si no funciona, siempre es mejor tener un plan B.

Así que nada, manos a la obra. Vamos a por el kanji señalado con el círculo en la imagen.

Sé lo que estás pensando: ¡Oh, Dios mío! Dame fuerzas...

Quizás te preguntes por qué he elegido un kanji tan complicado. La idea es que veas que, por difícil que parezca, se puede hacer. Y es útil: yo ahora mismo no me acordaba de cómo se leía este kanji ^_^U.

Lo primero es hacerse con una aplicación como kanjipad o tomoe. En linux es muy fácil, basta con buscar en el gestor de paquetes de tu distribución e instalarlas. Una o las dos. Cada una tiene sus pros y sus contras.

Lo siguiente es dibujar los trazos del kanji desconocido uno detrás de otro en el orden correcto. Puede parecer contradictorio, pero lo cierto es que es más fácil de lo que parece, y tampoco es necesario haber practicado caligrafía (書道) durante diez años. Como se puede comprobar, mi letra en japonés es bastante horrorosa, y sin embargo funciona.

Puede que a la primera no reconozca el carácter, lo más probable es porque te hayas equivocado de orden o se te haya escapado algún trazo de más, pero esta vez no tienes que preocuparte por lo primero. Gracias a que tomoe anota el ordinal de cada trazo, puedes ver en la siguiente captura el orden correcto.

Una vez trazado el dichoso carácter, en el margen de abajo (en kanjipad el margen derecho) aparecerán distintas alternativas. Si lo hemos hecho decentemente, y el programa no se hace la picha un lío, el kanji correcto será uno de ellos, normalmente el primero o el segundo.

Ya eres mío, pequeño...

Haciendo clic en él (1) se introducirá al instante en cualquier aplicación que admita IME. En este caso, el cuadro de búsqueda de Firefox (2). Ya sólo queda reconstruir la palabra o frase completa en la que teníamos interés y buscarla en un diccionario o usar uno de aquellos programitas tan útiles. Si te sabes el resto de lecturas es muy fácil. Si no, te tocará seguir dibujando e introduciendo los kanjis uno a uno.

En este caso, a mí personalmente sólo me interesaba el kanji 「祟」, pero por si alguien está interesado en todo el texto de la imagen anterior, es: 祟殺し編 其の壱 兄. La lectura en hiragana del batiburrillo anterior es たたりごろしへん そのいち あに, y el significado... ¡oh, venga! No querrás que te lo dé todo mascadito, ¿no? Busca un poco.

No hay más misterio (creo). Si te queda alguna duda, siempre puedes dejarme un comentario aquí debajo.

¡Hasta la semana que viene! (Eso espero).

5 comentarios:

  1. la verdad que muy interesante, pero se puede hacer sobre Windows?
    Muchas gracias!

    ResponderEliminar
  2. jaja mato flaco la pelota que le das a tu blog no seas tan pelotudo y atende un poco mas se me da que sos un tipo exelente pero loco si haces algo hacete responsable no seas el tipico blogerenfermo q crea cositas para figurar y despues de los primeros 2 o 3 laueles o aucalciles se borra.

    ResponderEliminar
  3. https://cha.isao.net/profile_oem/OEMCaptchaImage.php?ses_rec_id=ydpGvI6JgrTHVXoZBR
    hey saludos mira sera que me ayudas de verdad como se escriben esas imagenes, en la compu es que estoy haciendo un formulario para un juego y no puedo por lo mas que intento si me ayudas, te lo a gradeces muchas veces

    ResponderEliminar

Gracias por tu comentario...
¿Cómo que no vas a dejar ninguno?
¡Tu opinión es importante!
¿Te ha resultado útil este artículo? ¿Me he equivocado en algo?
¿Te gustaría hacerme alguna pregunta?
En cualquier caso, adelante.


コメントをありがとう···
「コメントしないっ」って···どいうこと?
あなたの意見は大切なんです!!
この投稿は···
役に立ちましたか?間違えたところあったんですか?
聞きたい質問がありますか?
何でもいいです。どうぞ。