-
Notifications
You must be signed in to change notification settings - Fork 49
Topónimos en el diccionario
Se considerarán topónimos generales todos aquellos que son útiles y/o necesarios para más de una localización, como pueden ser los nombres de continentes y países. Los topónimos locales son aquellos que tienen utilidad solamente en una única localización, como pueden ser las regiones, provincias y ciudades del país de la localización.
Los topónimos generales se ubican en ortograf/palabras/toponimos
, mientras que los topónimos para cada localización se deben ubicar en ortograf/palabras/toponimos/l10n/LOCALIZACION
donde LOCALIZACION
puede ser es_ES, es_AR, etc.
Pueden haber varios archivos de topónimos a efectos de organizarlos, por ejemplo, un archivos para los topónimos de provincias, uno para ciudades u otra forma útil para organizar los topónimos. Todos los archivos de topónimos deben tener en su nombre el prefijo toponimos-
.
Los lemas deben estar ordenados alfabéticamente.
En caso de que se disponga de un archivo con los lemas desordenados, se puede ordenar fácilmente con el comando sort -u < archivo_de_entrada_desordenado.txt > archivo_de_salida_ordenado.txt
donde la opción -u
(unique) filtra duplicados si los hubiera.
Los nombres compuestos se deben descomponer en sus lemas básicos (uno por línea). Los lemas comunes ya existentes, como el conector 'y', o la contracción 'del', e incluso 'Ciudad' se podría eliminar, ya que existe como nombre femenino y siempre se va a validar, aunque convendría dejarlo si se otorga un valor sintáctico distinto por formar parte de un nombre propio compuesto.
Por ejemplo, para añadir "Trinidad y Tobago" se deben añadir los temas "Trinidad" y "Tobago" por separado, eliminando el conector "y". Dado que dentro del archivo los lemas debe estar ordenados alfabéticamente, sería útil indicar en un comentario a que nombre compuesto corresponde el lema.
...
Trinidad # Trinidad y Tobago
...
Tobago # Trinidad y Tobago
...
- Discusión en el issue #38
- Referencias en nuestro wiki