Orígenes genéticos, singularidad y heterogeneidad de los vascos

«España se cuenta entre los pocos países que ofrecen, la posibilidad de aclarar la cuestión de su primitiva población por medio de una lengua aún viva dentro de sus fronteras.»

«Examen del estudio sobre los primitivos habitantes de Hispania a través de la lengua vasca»
Wilhelm Von Humboldt 1821

«El hecho de la conservación del vascuence es sin duda ninguna uno de los fenómenos históricos más extraordinarios. Es el único caso en Europa de supervivencia de una lengua indígena que ha resistido durante varios milenios invasiones e influencias y que aunque se ha dejado penetrar de infinidad de elementos extraños, ha mantenido su personalidad original»

Antonio Tovar (1911-1985), mentor de Koldo Mitxelena.

«Durante siglos se ha sumado las fuerzas para borrar y destruir dicha lengua y todavía nadie la ha sometido.»

Arnald Steiger, lingüista suizo (1896-1963).

«Más todavía que el nuestro [gobierno francés], que tampoco se libra, el gobierno español trabaja, y cómo, para hacer desaparecer lo más rápidamente posible la lengua vasca de las cuatro provincias«

Francique Michel, filólogo francés, en le Pays Basque, sa population, ses moeurs, sa litterature et sa musique (1857)

 

Lazkao Txiki, Goierriko bersolaria.

Impresión artística de la variedad genética alrededor de Euskal Herria. Proviene de la tesis doctoral del

principal autor del estudio, André Flores-Bello. Solo es una impresión no representa los resultados del presente estudio.

Este post intentaré entender el siguiente artículo, y comentarlo:

Artículo científico:
Flores-Bello et al., Genetic origins, singularity, and heterogeneity of Basques, Current Biology (2021), https://doi.org/10.1016/j.cub.2021.03.010 

André Flores-Bello,1 Frédéric Bauduer,2 Jasone Salaberria,3 Bernard Oyharçabal,3 Francesc Calafell,1 Jaume Bertranpetit,1 Lluis Quintana-Murci,4,5 and David Comas1

Traducción al castellano del cuerpo del artículo: Google + mis correcciones

Entrevista con David Comas, uno de los coautores en ETB Radio

Lo que presento es una interpretación mía de este estudio. Avisar que soy don Nadie, ni genetista ni filólogo, ni historiador, y aún así me atrevo a interpretar los resultados dentro de un contexto histórico. No sé si importa. Mis dudas me llevaron a borrar la primer versión de este post. 

Tengo la sensación de que este nuevo estudio genética no va a generar mucha simpatía en círculos de vascólogos porque contradice la cronología su narrativa sobre euskera batu zarra y los dialectos. Sitúa la existencia de estos últimos ya antes de la romanización, algo ya afirmado por Juan Martin Elexpuru en su informe sobre Veleia.

Creo que este estudio no es uno más, sino la primera vez que se hace un estudio sistemático de la zona vascohablante de antes y de hoy en día a una escala fina y con un buen conocimiento del terreno. Dos vascólogos de los cuales uno es euskaltzain, Beñat Oyharçabal, han participado. Los resultados me parecen muy interesante y creo que vale la pena de invertir tiempo y energía en entender el artículo. Hace referencia a un estudio anterior de genoma entero basado sobre todo en fósiles de la Península (Oalde et al., 2019) que miraremos brevemente. 

Quizás antes de entrar en los detalles del estudio tenemos que mirar un poco atrás para entender mejor la relevancia de este estudio. Estudios genéticos sobre los vascos aparecen como las setas cíclicamente y se suelen contradecir mutuamente, según los marcadores genéticos que se consideran o donde se encuentran los voluntarios en participar (en un barrio de inmigrantes o en zonas aisladas), de manera que no han sido de gran ayuda hasta hace poco en la mayoría de los casos.

Los estudios genéticas sufrían de grandes problemas:
– contaminación de muestras (propio ADN del investigador, del arqueólogo, etc.),
– una secuencia de ADN limitada (pocos marcadores genéticos, según los marcadores estudiados las conclusiones eran distintas),
– precio alto  (muy pocos individuos),
– ausencia de datos de otros estudios
– escasez de fósiles aptos (a más antigüedad más difícil es la conservación de suficiente ADN bueno)
– pobres diseños de estudio (qué es una persona representativa para una zona) con un número de individuos insuficiente.

La primera secuenciación de un genoma humano tardó 13 años con un precio de 2.700.000.000 $, y hoy en día se ofrecen por 300 $,  y los resultados tardan una semana. Esta revolución de genomas enteros y por el precio de un análisis de carbono catorce, ha sido la salvación de los estudios genéticos para el tipo de problemas como el objeto de este artículo. En vez de estudiar un par de marcadores se pueden comparar miles a la vez (unos 630.000 en este estudio!).

A partir de cerca 2015 los primeros estudios de genoma entero empezaban a ser factibles con los presupuestos de este tipo de investigaciones, lo que hace que hoy en día ya hay un número importante de genomas publicados de la población actual de Europa, aunque el problema de la escasez de fósiles sigue actual. Gracias a las técnicas de informática y estadística se pueden comparar los resultados con centenares de genomas actuales en bases de datos, y decenas o un poco más, de fósiles, aunque antes del neolítico sigue siendo difícil el asunto. En el estudio  de Oalde et al. 2019 solo aportan 4 individuos del mesolítico para toda la Península, lo que es anecdótico.

Como último, cuando se intenta entender estudios genéticos hay que primero mirar la fecha de estudio y averiguar si se trata de un estudio de genoma entero, y luego intentar entender si se está tratando poblaciones actuales, o fósiles, o los están mezclando, y cuantos genomas por zona y cómo los seleccionan, y qué datos recogen de bases de datos existentes. Luego no queda otra que confiar que las manipulaciones estadísticas son fiables. Según expertos como David Reich los más relevantes estudios utilizan genomas enteros, y estos son de los últimos 6 años.
 
El abstracto de la publicación»Genetic origins, singularity, and heterogeneity of Basques» de André Flores-Bello et al. traducido al castellano:

Los vascos han vivido históricamente a lo largo de los Pirineos Occidentales, en la región franco-cantábrica, a caballo entre los actuales territorios españoles y franceses. Durante las últimas décadas, han sido objeto de intensas investigaciones por sus singulares rasgos culturales y biológicos que, con alta controversia, los ubicaron como una población heterogénea, aislada y única. Se cree que su lengua no indoeuropea, el euskara, es un factor importante que configura el paisaje genético de los vascos. Sin embargo, todavía hay un animado debate sobre su historia y la singularidad asumida debido a las limitaciones de estudios previos. Aquí, analizamos datos de todo el genoma del vasco y grupos circundantes que no hablan euskara a nivel microgeográfico. Se analizaron un total de ∼629.000 variantes de todo el genoma en 1.970 muestras modernas y antiguas, incluidos 190 nuevos individuos de 18 ubicaciones de muestreo en el área vasca. Por primera vez, se han realizado análisis locales y a gran escala a partir de datos de todo el genoma que abarcan toda la región franco-cantábrica, combinando la frecuencia de alelos y métodos basados en haplotipos. Nuestros resultados muestran una clara diferenciación de los vascos de las poblaciones circundantes, con los franco-cántabros de habla no euskara ubicados en una posición intermedia. Además, se observa una marcada heterogeneidad genética dentro de los vascos con una correlación significativa con la geografía. Por último, la diferenciación vasca detectada no puede atribuirse a un origen externo respecto a otras poblaciones ibéricas y colindantes. En cambio, mostramos que tal diferenciación resulta de la continuidad genética desde la Edad del Hierro, caracterizada por períodos de aislamiento y falta de flujo genético reciente que podría haber sido reforzado por la barrera del idioma.

 El estudio fue realizado por científicos de la Universitat Pompoeu Fabra de Barcelona, y diferentes institutos franceses, y incluye dos filólogos vascos. Hay que destacar este enfoque multidisciplinario.
Las muestras de personas actuales son 10 a 11 por zona, y los voluntarios tenían que tener los dos abuelos de origen de la misma zona, de manera que se puede considerar la muestra como representativa. Traducimos los detalles del muestreo:

 «Se recolectaron un total de 190 muestras individuales de 18 zonas microgeográficas en los actuales territorios españoles y franceses de la región franco-cantábrica, incluyendo grupos de habla vasca y romance (español, francés, aragonés y gascón) (Tabla 1; Figura 1). Se obtuvo el consentimiento informado por escrito de los participantes, quienes fueron entrevistados para determinar su dialecto local y para confirmar que sus cuatro abuelos nacieron en la misma zona microgeográfica (Figuras 1 y S1; Tabla 1).(…)
El conjunto de datos incluye siete zonas donde se habla euskara en la actualidad6,18 (Gipuzkoa Central, Gipuzkoa Suroeste, Bizkaia y Noroeste Nafarroa en la vertiente sur de los Pirineos; la zona de Lapurdi / Baztan, Lapurdi / Nafarroa Beherea y Zuberoa en el norte, además de tres regiones donde se habló euskera al menos hasta fines del siglo XIX39,59 (Centro-Oeste de Nafarroa, Roncal y Araba). Las diez regiones anteriores en las que se hablaba euskara en tiempos históricos se denominarán «vasco». El conjunto de datos también incluye i) cinco áreas circundantes de habla hispana (Cantabria, Norte de Burgos, La Rioja, Norte de Aragón y Bizkaia Occidental; en el caso del norte de Aragón, todavía se habla una lengua local reliquia, el aragonés) y ii) tres zonas de habla gascón (Bigorre, Béarn y Chalosse) .4,39-41 En este último, las influencias de las lenguas arcaicas relacionadas con el euskara han sido sugerido5 (Figura S1), pero los registros del euskara hablado están ausentes. Además, Gascon ha sido reemplazado ampliamente por Francés, con menos de la mitad de la población en Béarn que es capaz de hablar el gascón con fluidez. Nos referimos a estos dos grupos de poblaciones como españoles y francés peri-vascos, respectivamente.»

La zona estudiada es la siguiente:

Figura 1. Zona de estudio.

Se distingue de zonas todavía euskaldun (gris oscuro) y zonas periféricas romanizadas en el pasado (gris ligero) relacionados con el euskera en tiempos históricos.

Los resultados gráficos del estudio son en realidad en general bastante inteligibles, y podemos hacer un esfuerzo de intentar entenderlos cualitativamente, y lo intentaremos a continuación.



Figura 2A. La zona contextualizado dentro la variación genética de Europa, Asia Oeste y el Norte de África por medio de Análisis de componentes principales. Es una técnica donde se puede visualizar la distribución de los datos individuales de manera más significativa, es decir de manera que se aprecia mejor su variación. Es la técnica estándar para analizar datos que dependen de muchos parámetros. Se observa claramente la posición especial de la actual zona euskaldun, y su estrecha relación con Iberia, y como las zonas del euskera histórico se sitúan entre ambos. Fijarse también en la posición singular de Cerdeña.

La figura 2 ilustra perfectamente la singularidad de la actual zona euskaldun, y como la zona «peri-vasca» a ambos lados de los Pirineos se solapa y sugiere una mezcla entre diferentes proporciones de contribuciones de sobre todo el resto de Iberia.

.


Figura 3A. En este análisis de clústeres en este dendrograma se busca identificar agrupaciones significantes dentro de los datos de manera jerarquizada. Se observan claramente como los euskaldunes actuales forman un grupo homogéneo por los lados de los Pirineos, y que los «peri-vascos» forman un grupo claramente definido cercanos a los demás ibéricos.

La figura 3A muestra en otro tipo de análisis la estrecha relación de por un lado los actuales euskaldunes de los dos lados de los Pirineos, y los peri-vascos con el resto de los ibéricos, como ya hemos observado en la figura 2A.


Figura 3C. «Homozygosidad» Esto hace referencia a los fragmentos de ADN que son idénticos en los dos cromosomas que cada persona lleva en sus células. Se puede entender como un medidor de consanguinidad. Se ven que los vascos superan con creces el resto Europa con la excepción de Cerdeña, aunque lo supera. 

 Este parámetro demuestra que los vascos han formado durante mucho tiempo un grupo muy cerrado, aparentemente el grupo más cerrado de Europa, junto con los sardos. Tengo curiosidad donde Islandia y las islas Faroe caerán.

Las figuras anteriores son muy objetivos y descriptivos. El origen de la siguiente figura es menos evidente para mi, aunque parece muy clara.


Figura 4. En este modelo matemático de mezclas se ve claramente ilustrada el efecto de la romanización sobre el genoma para las diferentes zonas de estudio. Llama la atención la mínima contribución de «sangre árabe» dentro el resto de Iberia. Se puede entender que la genética de Ibería se explica básicamente por un origen genética de la Edad de Hierro mezclado con «sangre» romano en diferentes porcentajes, y donde los actuales euskaldunes son los que se han «liberado» de importantes mestizajes con «romanos», y representan todavía la genética de la Edad de Hierro con muy pocas nuevas «ingredientes» .

Como ya comentado esto es una interpretación que no puedo seguir muy bien. Si lo creemos tenemos aquí una perfecta regla para medir la romanización!

 


 

Figura 6. Esta figura muestra el detalle del análisis de clústeres de la figura 3, y nos muestra relaciones muy fascinantes, creo yo, dentro del mundo de los euskaldunes actuales (derecha) y los peri-vascos (izquierda). Vemos por el lado de los euskaldunes actuales que se forman dos superclústeres (supergrupos), uno oriental/ central y otro con Araba y Bizkaia central juntos y… Nafarroa Oeste-Central, Y por otro lado un supercluster que forma dos clústeres menores, uno con Roncal/Behera Nafarroa y Zuberoa (Zuberoa y Roncal juntos), y otro cluster menor con por un lado Lapurdi y Nafarroa Noroeste, y por otro lado Gipuzkoa central y suroeste.

Por el lado de los peri-vascos observamos una agrupación también con fuerte orientación geográfica, con un alejado Cantabria que no pertenece al superclúster del resto.

Quizás es esta figura que va a levantar más polvo porque se ‘mete’ con la dialectología, y los autores sugieren/concluyen que está compartimentación genética es más antigua que la compartimentación de los dialectos supuestamente solo a partir del siglo VII.

¿Apunta en el caso ‘peri-vasco/vasco la compartimentación genética, o a la historia de lenguas? Esto es el debate.

¿Pueden idiomas formar una barrera genética casi impenetrable comparable a la de una isla rodeada por mar?

Para entender mejor las observaciones genéticas tenemos que mirar la evolución genética de la Península Iberica:



Figura Oalde et al. 2019. The genomic history of the Iberian Peninsula over the past 8000 years. Science. 2019 March 15; 363(6432): 1230–1234. doi:10.1126/science.aav4040. 

La figura muestra las diferentes aportaciones genéticas al genoma de los ibéricos en el tiempo desde el mesolítico. Las aportaciones indoeuropeos son representados en amarillo, suponemos que la última de alrededor de 1000 antes de la era (BCE) tiene algo que ver con invasiones «celtas», es cuando aparecen los castros también en Euskal Herria (quizás algo/bastante más tarde). Durante el final de la Edad de Hierro, antes de la llegada de los romanos los «vascónicos» de repente se van en «modo isla», y se aíslan genéticamente de los acontecimientos del resto de la Península y de Europa hasta hoy en día. Esto es muy fascinante para mi.

 

Ahora algunas especulaciones mías:
¿Si los ibéricos compartían con los «vascónicos de antaño» sus genes hasta la Edad de Hierro esto no parece indicar que por entonces o algo antes compartían un mismo tipo de idioma preindoeuropeo?

 

¿Cual es la razón para aislarse? ¿Es un cambio del idioma alrededor? 

En mi idea las invasiones celtas, un pueblo de guerreros como afirman las fuentes antiguas, obligaban a los ‘vascónicos’ a retirarse en las zonas más marginales y poco a poco se celtizaban esas zonas, lo que sugiere Alfaro en las Tierras Altas de Soria. Aparentemente los iberos eran capaz de frenar los celtas. Ambas culturas se caracterizan por una cultura de armas, algo que no se encuentra casi en la zona que es ahora euskaldun. Sí lo encuentran en La Hoya, donde Idoia y Eliseo escavaron, pero esta zona probablemente era mayoritariamente celta estando al lado del Ebro, muy celtizado. Quizás que las invasiones romanas cambiaron el equilibrio al mantener controlado a los pueblos celtas, mientras que los ‘vascónicos’ se retiraban y se aislaban, como sugiere la genética con altos niveles de homozygotisidad. Esa es la lectura que hago yo del artículo.

 


¿Quién lo descifra?


EPÍLOGO

Unas reflexiones personales desde mis experiencias con las lenguas indoeuropeos y pre-indoeuropeos: ¿Las lenguas pueden ser barreras genéticas efectivas?

Soy eterno estudiante del euskera, y soy muy mediocre o mejor dicho un estudiante «pencado» (como dicen los jóvenes ahora). Como muchos extranjeros me enamoré de este idioma tan sofisticado, pero sobre todo con tanta capacidad poética y belleza.

Pero los verbos auxiliares que son el núcleo del euskera me generan una terrible quebradura de cabeza, y creo que los domino en el presente, pero me quedo colgado en el pasado. No consigo a dominarlos, y mi cerebro me sugiere de parar. Confieso que cuando estoy escribiendo en castellano tengo que mirar tres veces para concordar todos los géneros. Hasta esto me resulta de una cierta complejidad. Concordar en euskera el auxiliar con el sujeto, el objeto directo e indirecto y mientras tanto poniendo las declinaciones y acordarme que detrás de un numeral no se escribe-ak, etc., y no olvidarme de que estaba hablando, es algo que consigo sobre papel a modo de puzzle, pero no hablando. Me considero una persona normal, aunque con cierta dislexia, no muy dado para los idiomas pero aún así sé explicarme y hacer entenderme bastante bien en varios idiomas. He venido a Euskal Herria con 40 años, y siento vergüenza todavía de no dominar el euskera, aunque sigo con mi optimismo adelante. 

Mi idioma, el flamenco, se parece bastante al inglés y nos olvidamos de las desinencias de los verbos en gran medida (el inglés lo lleva al extremo con solo el tercer persona singular en el presente un cambio), no necesitamos declinar, lo que tenemos para expresarnos con presición es un muy sutil sistema de posición de las palabras que nos indica toda la información necesaria. El francés aprendemos también desde pequeño, y aprender castellano ha sido un proceso fácil, sin gran esfuerzo, y creo que podría aprender italiano en poco tiempo. Latín era para mi otro fracaso, me topé también con esa lengua muy analítica, que no me entró nada bien en la cabeza, y creo que tengo este problema con el euskera por la misma razón que con el latín. También el latín me encantaba…

Cuento estos datos personales a modo de introducción para señalar que las lenguas pre-indoeuropeos son tenaces si eres indoeuropeo y hablas un idioma con una determinada estructura muy diferente, y ya no eres un niño. Cuando Lakarra afirma que por el siglo VI/VII el euskera antiguo cambia de un idioma Sujeto Verbo Objeto a un idioma Sujeto Objeto Verbo y que se introducen declinaciones, un artículo definido tipo -a o -ak en plural, y para más inri el idioma se vuelve ergativo con desinencia -k/-ek, pienso que esto es completamente irreal. Los idiomas tienen tendencia a simplificarse porque el cerebro es vago, y busca atajos para tener más libertad para expresarse. El inglés es en este sentido el colmo porque puedes convertir cualquier sustantivo en verbo, y al revés sin cambiar ni una letra: surf: oleaje, to surf: moverte con una tabla sobre las olas, y mucho más. 

Lo mismo pasa con el inicio de la diversificación de los dialectos en esa misma época milagrosa sin testigos escritos. Los dialectos existentes empiezan desarrollarse a partir de más o menos el Monasterio de Leire después del reseteo general del eusker batu zarra según esa hipótesis.

El euskera batu berria se ha instalado a partir del año 1969, y medio siglo más tarde a pesar de todos los medios de combinación y mayor movilidad, los dialectos siguen vivos, y los del Goierri siguen sin entender bien a los de la costa occidental de Gipuzkoa o a los bizakainos. Me temo que también se está hablando en este caso de un proceso irreal. Hay que tomar en cuenta que en casi todo la Edad Media las fuentes eran personas religiosas con una educación más universal, pero la mayoría de la población, los pastores y agricultores vivían casi en sistemas autónomas y no salían del pueblo casi.

Habrá razones antropológicos y culturales porque los euskaldunes se convirtieron en modo isla a partir de la Edad del Hierro, aislándose en gran medida a nivel genética. Pero hay el ejemplo de otros pueblos que han sabido defender su cultura y idioma milenario con cierto éxito contra todas las fuerzas destructivas: los judíos y gitanos.

Todas las otras lenguas/culturas prerromanos han perdido la batalla contra el tiempo aparte de la cultura celta. Es algo muy espectacular y digno de orgullo.