Métodos numéricos de la bioinformática aplicados al estudio diacrónico de las lenguas chibchas

Autores/as

  • David Jiménez Universidad de Costa Rica, Costa Rica
  • Haakon Krohn Universidad de Costa Rica
  • Ernesto García-Estrada Universidad de Costa Rica, Costa Rica
  • Viviana Solís Solís Universidad de Costa Rica, Costa Rica

Palabras clave:

alineación, bioinformática, lenguas chibchas, lingüística histórica, algoritmo Needleman–Wunsch

Resumen

En este estudio se aplicaron métodos de la bioinformática para generar una clasificación genealógica de 17 lenguas de la familia chibcha a partir de una lista de vocabulario básico. Todas las palabras de todos los posibles pares de lenguas se alinearon mediante el algoritmo Needleman–Wunsch, originalmente elaborado para la alineación de secuencias genéticas. Luego, se calculó una distancia normalizada entre los vocablos alineados, tomando en cuenta la cantidad de rasgos distintivos que diferían entre los fonemas. Este procedimiento se asemeja al método léxico-estadístico tradicional, pero se diferencia por el hecho de que no involucra un registro binario de cognados. Con base en la distancia promedio entre cada par de lenguas, se generó un árbol binario. Los resultados indican que la identificación manual de cognados puede omitirse en la clasificación genealógica de lenguas y que, en cambio, el cálculo de distancias fonológicas en términos de rasgos distintivos puede producir agrupaciones más precisas.

Descargas

Los datos de descarga aún no están disponibles.

Referencias

Bergsland, K. & Vogt, H. (1962). “On the validity of glottochronology”. Current Anthropology, 3(2), pp. 115-153.

Centro de Investigación y Documentación de la Costa Atlántica. (1987). Diccionario elemental rama. Retrieved from http://www.turkulka.net/docs/RMA001R035I001.pdf

Constenla Umaña, A. (1981). Comparative Chibchan Phonology (Doctoral thesis). University of Pennsylvania, USA.

Constenla Umaña, A. (1985a). “Clasificación lexicoestadística de las lenguas de la familia chibcha”. Estudios de Lingüística Chibcha, 4, pp. 155-197.

Constenla Umaña, A. (1985b). “Las lenguas dorasque y chánguena y sus relaciones genealógicas”. Revista de Filología y Lingüística de la Universidad de Costa Rica, 11(2), pp. 81-91.

Constenla Umaña, A. (1989). “La subagrupación de las lenguas chibchas: algunos nuevos indicios comparativos y léxico-estadísticos”. Estudios de Lingüística Chibcha, 8, pp. 17-72.

Constenla Umaña, A. (1990, August). En torno a la subagrupación de las lenguas chibchas (Talk). Las sociedades no imperiales en los países visitados por Cristóbal Colón durante sus cuatro viajes al nuevo mundo, Panama City.

Constenla Umaña, A. (1995). “Sobre el estudio de las lenguas chibchenses y su contribución al conocimiento del pasado de sus hablantes”. Boletín del Museo del Oro, 38-39, pp. 13-55.

Constenla Umaña, A. (1998). Gramática de la lengua guatusa. Heredia: Editorial de la Universidad Nacional.

Constenla Umaña, A. (2005). “¿Existe relación genealógica entre las lenguas misumalpas y las chibchenses?” Estudios de Lingüística Chibcha, 24, pp. 7-85.

Constenla Umaña, A. (2007). La lengua de Térraba. San José: Editorial de la Universidad de Costa Rica.

Constenla Umaña, A. (2008). “Estado actual de la subclasificación de las lenguas chibchenses y de la reconstrucción fonológica y gramatical del protochibchense”. Estudios de Lingüística Chibcha, 27, pp. 117-135.

Constenla Umaña, A. (2012). “Chibchan languages”. In L. Campbell & V. Grondona (Eds.), The indigenous languages of South America: a comprehensive guide (pp. 391-439). Berlin/Boston: De Gruyter Mouton.

Covington, M. A. (1996). “An algorithm to align words for historical comparison”. Computational Linguistics, 22(4), pp. 481-496.

Crick, F., Barnett, L., Brenner, S. & Watts-Tobin, R. (1961). “General nature of the genetic code for proteins”. Nature, 192(4809), pp. 1227-1232.

Dixon, R. M. W. (1997). The rise and fall of languages. Cambridge: Cambridge University Press.

Eska, J. F. & Ringe, D. (2004). “Recent work in computational linguistic phylogeny”. Language, 80, pp. 569-582.

Forster, K. D. (2011). Paya kuna: an introductory grammar. Dallas: SIL International. https://www.sil.org/system/files/reapdata/52/88/95/52889502165272309191140937197112082328/LCDD_14_Paya_Kuna.pdf

Gabb, W. (1875). “On the Indian tribes and languages of Costa Rica”. Proceedings of the American Philosophical Society, 14(95), pp. 438-602. https://www.jstor.org/stable/981937#metadata_info_tab_contents

Gómez Aldana, D. F. (2020, September 5). Diccionario muisca-español. http://muysca.cubun.org/Categor%C3%ADa:Diccionario

Hayes, B. (2009). Introductory Phonology. Chichester: Wiley-Blackwell.

Headland, E. R. (1997). Uw cuwa (tunebo) – español, español – uw cuwa (tunebo), con una gramática uw cuwa (tunebo). Bogotá: Instituto Lingüístico de Verano. Retrieved from https://www.webonary.org/tunebo/files/DiccBilTunebo-Esp_37538.pdf

Henikoff, S. and J. G. Henikoff. (1992). “Amino acid substitution matrices from protein blocks”. Proceedings of the National Academy of Sciences, 89(22), pp. 10915-10919.

Herzog, W. (1886). “Über die Verwandtschaftsbeziehungen der costaricensischen Indianer-Sprachen mit denen von Central- und Süd-Amerika”. Archiv für Anthropologie, 16, pp. 623-627.

Holt, D. (1999). Pech (Paya). Munich: Lincom Europa.

Huber, R. Q. & R. B. Reed. (1992). Vocabulario comparativo. Palabras selectas de lenguas indígenas de Colombia. Bogotá: Instituto Lingüístico de Verano.

Huffman, D. A. (1952). “A method for the construction of minimum-redundancy codes”. Proceedings of the IRE, 40(9), pp. 1098-1101.

Kessler, B. (2001). The Significance of Word Lists: Statistical Tests for Investigating Historical Connections between Languages. Stanford, CA: CSLI Publications.

Krohn, H. S. (2021). “Vowel systems of the Chibchan languages”. Forma y Función, 34(2). https://doi.org/10.15446/fyf.v34n2.88423

Krohn, H. S. (2022). Diccionario bribri–español español–bribri. Retrieved from http://www.haakonkrohn.com/bribri

Landaburu, J. (2000). “La lengua ika”. In M. S. González de Pérez & M. L. Rodríguez de Montes (Eds.), Lenguas indígenas de Colombia: una visión descriptiva (pp. 733-748). Bogotá: Instituto Caro y Cuervo.

Levenshtein, V. I. (1966). “Binary codes capable of correcting deletions, insertions, and reversals”. Soviet Physics-Doklady, 10(8), pp. 707-710.

List, J. M. (2010). Phonetic alignment based on sound classes. In M. Slavkovik (Ed.), Proceedings of the 15th Student Session of the European Summer School for Logic, Language and Information (pp. 192-202). Copenhague.

List, J. M. (2014). Sequence comparison in historical linguistics (Doctoral thesis). Düsseldorf University, Germany.

List, J. M., Walworth, M., Greenhill, S. J., Tresoldi, T. & Forkel, R. (2018). “Sequence comparison in computational historical linguistics”. Journal of Language Evolution, 3(2), pp. 130-144. https://doi.org/10.1093/jole/lzy006

Lohr, M. (2000). “New approaches to lexicostatistics and glottochronology”. In C. Renfrew, A. McMahon & L. A. Trask (Eds.), Time Depth in Historical Linguistics (Vol. 1, pp. 209-223). Cambridge: McDonald Institute for Archaeological Research.

Mallory, J. P. & Adams, D. Q. (2006). The Oxford Introduction to Proto-Indo-European and the Proto-Indo-European World. Oxford: Oxford University Press.

Margery Peña, E. (1989). Diccionario cabécar-español español-cabécar. San José: Editorial de la Universidad de Costa Rica.

Margery Peña, E. & Arias Rodríguez, M. (2005). “Vocabulario español-bocotá”. Estudios de Lingüística Chibcha, 24, pp. 87-121.

McMahon, A. & McMahon, R. (2006). “Why linguists don’t do dates: evidence from Indo-European and Australian languages”. In P. Forster & C. Renfrew (Eds.), Phylogenetic Methods and the Prehistory of Languages (pp. 153-160). Cambridge: McDonald Institute for Archaeological Research.

Meléndez Lozano, M. A. (2000). “Reseña bibliográfica del chimila”. In M. S. González de Pérez & M. L. Rodríguez de Montes (Eds.), Lenguas indígenas de Colombia: una visión descriptiva (pp. 789-792). Bogotá: Instituto Caro y Cuervo.

Mogollón Pérez, M. C. (2000). “Fonología de la lengua barí”. In M. S. González de Pérez & M. L. Rodríguez de Montes (Eds.), Lenguas indígenas de Colombia: una visión descriptiva (pp. 219-227). Bogotá: Instituto Caro y Cuervo.

Müller, F. (1882). Grundriss der Sprachwissenschaft (vol. 2). Vienna: Alfred Hölder.

Needleman, S. B. & Wunsch, C. D. (1970). “A general method applicable to the search for similarities in the amino acid sequence of two proteins”. Journal of Molecular Biology, 48(3), pp. 443-453.

Orán, R. B. & Wagua, A. (2011). Gayamar sabga. Diccionario escolar gunagaya-español. Panama City: Equipo EBI Guna, AECID, MEDUCA and MEF.

Ortiz Ricuarte, C. (2000). “La lengua kogui: fonología y morfosintaxis nominal”. In M. S. González de Pérez & M. L. Rodríguez de Montes (Eds.), Lenguas indígenas de Colombia: una visión descriptiva (pp. 757-780). Bogotá: Instituto Caro y Cuervo.

Pache, M. J. (2018). Contributions to Chibchan Historical Linguistics (Doctoral thesis). Leiden University, The Netherlands.

Peust, C. (2015). Towards establishing a new basic vocabulary list (Swadesh list) (Unpublished manuscript). http://www.peust.de/peustBasicVocabularyList.pdf

Portilla, M. (2014). “La posición del naso (térraba-teriba) dentro de la ramaístmica de la familia chibcha”. Estudios de Lingüística Chibcha, 33, pp. 241-264.

Quesada, J. D. (2000). A grammar of Teribe. Munich: Lincom Europa.

Quesada Pacheco, M. Á. (1999). Diccionario boruca - español español - boruca. San José: Editorial de la Universidad de Costa Rica.

Quesada Pacheco, M. Á. (2018). Diccionario guaymí (ngäbere) - español y español-guaymí (ngäbere). Munich: Lincom Europa.

Quesada Pacheco, M. A. (2019). Gramática boruca. Múnich: Lincom.

República de Honduras. (2018). Diccionario bilingüe escolar pesh - español, español - pesh. Tegucigalpa: Secretaría de Educación.

Steiner, L., Cysouw, M. & Stadler, P. (2011). “A pipeline for computational historical linguistics”. Language Dynamics and Change, 1(1), pp. 89-127. https://doi.org/10.1163/221058211X570358

Swadesh, M. (1955). “Towards greater accuracy in lexicostatistic dating”. International Journal of American Linguistics, 21(2), pp. 121-137.

Swadesh, M. (1971). The origin and diversification of language. Piscataway, New Jersey: Transaction Publishers.

Trillos Amaya, M. (2000). “Categorías gramaticales del ette taara: lengua de los chimilas”. In M. S. González de Pérez & M. L. Rodríguez de Montes (Eds.), Lenguas indígenas de Colombia: una visión descriptiva (pp. 749-756). Bogotá: Instituto Caro y Cuervo.

Uhle, M. (1890). “Aminberwandtschaften und Wanderungen der Tschitscha”. Proceedings of the International Congress of Americanists, 7, pp. 466-489.

Watson, J. D. & Crick, F. H. (1953). “A structure for deoxyribose nucleic acid”. Nature, 171(4356), pp. 737-738.

Wichmann, S., Müller, A. & Velupillai, V. (2010). “Homelands of the world’s language families: A quantitative approach”. Diachronica, 27(2), pp. 247-276.

Zhang, M. & Gong, T. (2016). “How many is enough? Statistical Principles for Lexicostatistics”. Frontiers in Psychology, 7, 1916. https://doi.org/10.3389/fpsyg.2016.01916

Descargas

Publicado

2023-08-22

Número

Sección

Artículos

Cómo citar

Métodos numéricos de la bioinformática aplicados al estudio diacrónico de las lenguas chibchas. (2023). Semas, 4(8), 41-62. https://semas.uaq.mx/index.php/ojs/article/view/123