Humanidades digitales e historia de los medios • un desafío para la investigación histórica de periódicos

Resumen
Las humanidades digitales son un desafío importante para las disciplinas de humanidades más tradicionales, pero los métodos digitales avanzados de análisis no se utilizan a menudo para responder preguntas de investigación concretas en estas disciplinas. Este artículo hace uso de extensas colecciones digitales de periódicos históricos para discutir la prometedora pero desafiante relación entre las humanidades digitales y la investigación histórica. La búsqueda de patrones a largo plazo en la investigación histórica digital se posiciona apropiadamente dentro de enfoques previos a la investigación histórica, pero la digitalización de fuentes presenta muchas preguntas y obstáculos prácticos y teóricos. Por esta razón, cualquier fuente digital utilizada en la investigación histórica debe ser revisada críticamente de antemano. La investigación de periódicos digitales plantea nuevos problemas y presenta nuevas posibilidades para responder mejor a las preguntas tradicionales.

El uso de colecciones de periódicos digitales en la investigación histórica es bastante nuevo, pero algunos de los problemas y posibilidades relacionados con este tipo de investigación pueden ser bastante antiguos. Este artículo tiene como objetivo explorar este tema en el contexto más amplio del auge de las humanidades digitales, especialmente la historia digital. La gran pregunta aquí es si estamos ante una revolución en las humanidades o un choque de innovaciones y tradiciones que puedan reconciliarse fructíferamente. Esto también plantea interrogantes sobre la necesidad de la alfabetización digital en la ciencia histórica. Haciendo zoom sobre los potenciales digitales más específicos para la historia de los periódicos, se discutirán algunos problemas teóricos y prácticos. una mirada mas cercana está dedicada a un ejemplo específico de investigación de periódicos digitales en un contexto histórico. Este proyecto ‘Pidemehs’ trató de descubrir la interacción de la política y los periódicos en un largo período de la historia holandesa entre 1918 y 1967. Los hallazgos enfatizan la necesidad de ver la historia digital como un enfoque complementario, en lugar de uno que pueda reemplazar los enfoques históricos tradicionales. La investigación de los periódicos digitales plantea nuevos tipos de preguntas y ofrece nuevas formas de responder a las preguntas tradicionales.

Enfrentamientos en Humanidades Digitales e Historia Digital

Aunque el primer manual sobre humanidades digitales se publicó en 2004, se basa en la tradición del uso de computadoras en la investigación histórica que se remonta al auge de la investigación asistida por computadora a fines de la década de 1940.2 Las humanidades digitales en la actualidad siguen siendo un campo experimental, pero de rápido crecimiento, de la investigación y la educación académicas. conectar las metodologías tradicionales de humanidades (por ejemplo, la hermenéutica histórica) con herramientas que los investigadores pueden utilizar para seleccionar o acceder a colecciones en línea y analizar grandes conjuntos de datos. La investigación de este tipo ha provocado respuestas mixtas, especialmente en las ciencias históricas.

En un número especial de BMGN – Low Countries Historical Review en 2013, varios historiadores debatieron las posibilidades, problemas y trampas de la «historia digital» sin llegar a algún tipo de acuerdo sobre su valor. Eso parece lógico porque se ha realizado, probado y evaluado adecuadamente relativamente poca investigación histórica utilizando fuentes digitales. Aunque algunos historiadores practican la investigación asistida por ordenador desde los años sesenta, la historia digital se encuentra todavía en el comienzo de su desarrollo. Las preguntas fundamentales sobre la disponibilidad y la capacidad de control de las fuentes y sobre los nuevos métodos necesarios para la investigación digital aún necesitan respuestas. Además, una infraestructura funcional y abiertamente accesible para la investigación y la presentación de la investigación en humanidades digitales no está operativa en la mayoría de los países. Aún así, a pesar de todos los problemas y obstáculos técnicos y metodológicos, las humanidades digitales brindan grandes oportunidades para nuevas investigaciones de que la naturaleza es «global, transhistórica y transmedia» y ha dado lugar a afirmaciones impresionantes sobre su impacto potencial. En términos generales, estas afirmaciones dividen al mundo de las humanidades en fanáticos entusiastas y críticos vacilantes. En relación con la profesión histórica, se ha dicho que «lo digital» ha dividido la profesión entre «creyentes incondicionales y agnósticos decepcionados» .3

Los agnósticos tienden a decir que hasta ahora la revolución digital no creó una verdadera revolución paradigmática, pero es una ‘revolución práctica’ en el fondo, lo que hace que las búsquedas de palabras clave relativamente simples en fuentes singulares en línea sean mucho más fáciles.4 ‘Creyentes incondicionales’, como Rens Bod en su conferencia inaugural de 2012 en la Universidad de Ámsterdam, afirman que van a revolucionar las humanidades a una versión 3.0 que lo abarca todo. Afirmó que después del establecimiento de las tradiciones hermenéuticas y críticas de las humanidades 1.0 en los siglos XIX y XX, ahora estamos involucrados en la búsqueda de patrones históricos en el big data digital en humanidades 2.0. Eso es bastante similar a lo que el historiador de los medios Bob Nicholson llama ‘el giro digital en la historia cultural 2.0’. Los defensores de esta idea dicen que los historiadores de los medios modernos deberían buscar patrones y desarrollos en lugar de realizar una investigación tradicional e interpretativa de casos históricos mediáticos separados y específicos. En el futuro, Bod ve el gran desafío en encontrar una combinación de 1.0 y 2.0 en Humanities 3.0: una etapa en la que las tradiciones hermenéuticas críticas se combinan con enfoques digitales que son capaces de mapear patrones y desarrollos integrales.6

Esta idea de fases en el desarrollo de las humanidades o las ciencias históricas que están determinadas por la naturaleza y disponibilidad de fuentes (analógicas o digitales) y el objetivo de la investigación histórica (interpretar eventos únicos en formas narrativas o reconstruir y analizar ‘patrones’) reaviva una vieja división fundamental. en la ciencia histórica. Por un lado, están los historiadores que elaboran narrativas a partir del estudio detallado de una pequeña muestra de fuentes ejemplificadoras. Por otro lado, los historiadores tienen como objetivo analizar los desarrollos a largo plazo basados en un conjunto variado de fuentes (casi) completas o representativas, proporcionando conclusiones que cubren un gran lapso de tiempo.

Estos últimos encuentran nuevos argumentos en «la sociedad digital» con sus aparentemente infinitas posibilidades para dar forma y conectar la información y el conocimiento, en cualquier lugar y en cualquier momento. En las discusiones que acompañan a este surgimiento de la ‘sociedad digital’ se puede ver una marcada división entre las personas que visualizan una sociedad totalmente nueva donde las relaciones políticas, económicas, tecnológicas y sociales se moldearán sobre una base totalmente diferente, y las personas que enfatizan el poder de la cultura tradicional para adaptarse a estos desafíos. Es una división entre deterministas tecnológicos y culturales.7 Este choque entre el determinismo tecnológico (a veces también llamado ‘solucionismo’ o ‘creencia en lo sublime tecnológico’) y la crítica cultural es algo artificial, porque muchos investigadores están abiertos al diálogo. Pero el «discurso hiperbólico que rodea a los medios digitales» no es muy fructífero para invitar a académicos con orientación cultural que quieran estar convencidos del valor práctico de los métodos de investigación digitales.8

Más específicamente, el choque se puede ver en la historiografía. En su provocativo Manifiesto Histórico, Armitage y Guldi muestran, por ejemplo, la típica combinación determinista tecnológica de lenguaje preocupante sobre tradiciones analógicas obsoletas y las promesas ilimitadas de ‘grandes datos’ que pueden ser ‘extraídos’ para reconstruir ‘ » y crean una especie de paraíso académico. Afirman nada menos que el poder de los grandes datos para iluminar la sombra de la historia ». 9 Los historiadores más culturales ven este tipo de afirmaciones ambiciosas para redefinir la investigación histórica en torno al paradigma digital » o se convierte en una amenazante adquisición por parte de un científico cuantitativo con una creencia ilimitada en la racionalidad tecnológica. A sus ojos, la «mecanización» del proceso heurístico amenaza con reprimir una actitud crítica y devaluar el análisis cultural y contextualizado.10

De hecho, el llamado de Armitage y Guldi para «salvar» la ciencia histórica cambiando el enfoque de la investigación de detalles únicos hacia patrones generalizados no es totalmente nuevo. En algunos aspectos, puede verse como un renacimiento digital del movimiento Annales. Este movimiento de origen francés, pero decisivamente internacional, inspiró a generaciones de historiadores desde los años treinta. La idea central era abordar la historia como una longue durée, un desarrollo a largo plazo que se puede encontrar en la vida social y económica, pero también en la cultura y la mentalidad. Annales-historiadores buscaban metanarrativas generales, utilizando una combinación de datos de tendencias históricas cuantitativas y microhistorias cualitativas que ilustraran las tendencias en un nivel diferente. En la visión de Armitage y Guldi, un resurgimiento de esta idea es una forma de seguir el ritmo de la creciente influencia de los economistas y científicos sociales en los debates públicos actuales y futuros. También ofrece la posibilidad de mantener las ciencias históricas en sintonía con las formas en que las nuevas y futuras generaciones de académicos formulan preguntas de investigación, realizan búsquedas y conectan interactivamente la presentación de resultados con el mundo en línea.

El debate sobre «el giro digital» en la ciencia histórica muestra la vieja cuestión ideológica de si la historia debería centrarse hermenéuticamente en comprender y contextualizar eventos únicos o en analizar estructuras y patrones basados ​​en unidades y datos cuantificables. En la década de los setenta, este debate recurrente se pudo ver en las discusiones históricas sobre la necesidad de integrar la teoría y la metodología sociológica y económica en la investigación histórica. Se consideró un cambio en la investigación que podría probar por fin que la historia era ‘una ciencia real’ con hipótesis falsas y métodos y modelos verificables.11 Las preguntas en este debate teórico se relacionan directamente con el problema más práctico si los historiadores deben usar ‘documentos’ o ‘datos’. , o, en otras palabras, debería interpretar y contar historias o proporcionar evidencia cuantitativa para hipótesis.12 Según Rieder y Röhle, los métodos digitales realmente plantean la pregunta: ¿las dosestadísticas y los algoritmos alcanzan un nivel más alto de objetividad que la interpretación humana? Una segunda pregunta se refiere al dominio de la producción visual en la investigación en humanidades digitales. Gran parte de esta investigación parece prosperar gracias a las espectaculares animaciones de «infografías» y «conmoción y asombro». ¿Son este tipo de resultados más importantes que otros resultados? La visualización es, por supuesto, tentadora, porque nos da una imagen (a veces animada) de patrones en la historia y, para algunas personas, el material visual (a menudo llamado «evidencia») es más poderoso que la evidencia en palabras, que a menudo se llama «argumentativa» 13.

Josh Begley, Todas las portadas del NYT desde 1852. Ejemplo de una animación de «conmoción y asombro» basada en material periodístico digitalizado.

Los narradores interpretativos, como los historiadores culturales, tienden a pensar que no podemos comprender procesos históricos o culturales complejos sin una noción sobre lo que constituye e impulsa la cultura. En su opinión, el uso exclusivo de datos cuantitativos, la búsqueda de «patrones» y convertir la historia en una ciencia social son, por lo tanto, demasiado limitados o incluso engañosos. En las palabras clásicas del historiador cultural Robert Darnton: ` los científicos sociales viven en un mundo más allá del alcance de los mortales ordinarios, un mundo perfectamente organizado en patrones perfectos de comportamiento, poblado por tipos ideales y gobernado por coeficientes de correlación que excluyen todo menos las desviaciones más estándar. . ‘Un mundo así nunca se puede unir con lo que Darnton llama,’ el tema de la historia ‘. 14 Esta crítica es familiar para la crítica de la’ cultura algorítmica ‘que se formula en la sociedad digital. Los críticos dicen que esta dependencia del código, los lenguajes informáticos y el razonamiento algorítmico es problemática, o incluso incompatible con, el enfoque interpretativo crítico que todavía constituye la base de la mayoría de las investigaciones en humanidades.15

En este acalorado debate, existe el peligro de una condena mutua no constructiva. En lugar de subrayar el determinismo tecnológico y cultural infranqueable, es mucho más fructífero concebir los enfoques divergentes como un conjunto de cuestiones metodológicas y prácticas que deben ser abordadas y resueltas en investigaciones concretas y deben ser objeto de una evaluación metodológica constante. El escepticismo crítico sobre la historia digital crea un antagonismo artificial entre los métodos cuantitativos y cualitativos o, para decirlo con más dureza, entre la investigación histórica «científica, digital» e «interpretativa, analógica» 16.

Sin embargo, en las prácticas de investigación, por lo general, tanto las perspectivas como los métodos se utilizan de manera complementaria.17 Los temores de los historiadores culturales de que su propiedad sobre el campo histórico sea robada o borrada por una inundación digital, no demuestra mucha autoestima. confianza. Si el debate histórico sobre la metodología de los Annales, por ejemplo, muestra algo, es que los enfoques estructuralista y cuantitativo no reemplazaron, sino que a la larga fortalecieron los enfoques históricos culturales, políticos, biográficos y otros cualitativos o interpretativos.

En la investigación histórica, la década de los noventa incluso dio lugar a un «giro cultural» como respuesta al surgimiento de métodos cuantitativos provenientes de la historia social y económica. Esto podría verse, por ejemplo, en la historia de los medios. De centrarse en los grandes procesos en la producción de medios institucionales y los desarrollos sociales y políticos, la atención se desplazó hacia el contenido de los medios y su significado en el contexto histórico específico de la recepción de los medios por parte de los públicos, cada uno con un trasfondo cultural diferente.18

Todo esto indica que «el giro digital» no significa necesariamente desperdiciar los puntos fuertes de los enfoques culturales. Se puede progresar si entendemos qué son los datos culturales digitales, qué hacen exactamente las herramientas digitales y cómo se pueden ajustar y contextualizar los resultados en conjuntos más amplios de fuentes históricas. Como afirma Berry en un volumen editado con reflexiones sobre las humanidades digitales: « El pensamiento con soporte computacional no tiene por qué ser deshumanizador (…) pero puede darnos mayores poderes de pensamiento y un mayor alcance para nuestra imaginación … ». 19 Por supuesto, uno debe reconocer que hay un diferencia entre la tradicional lectura atenta de una cantidad limitada de textos y la «lectura a distancia» de grandes cantidades de datos. Sin embargo, los historiadores no deberían convertirse en lo que no son: científicos informáticos. Deberían utilizar nuevos métodos para ampliar su horizonte y posibilidades de responder preguntas de valor histórico.

Por otro lado, los historiadores digitales deberían ser más conscientes de que existe una gran y comprensible diferencia entre el significado estadístico o algorítmico al que se suscriben los ingenieros informáticos y de software y el significado cultural o histórico que atribuyen los historiadores como una forma de contextualizar la historia. En términos generales, «la forma en que funcionan las computadoras no es automáticamente compatible con la forma en que trabajan los historiadores» .20 En realidad, no de forma automática, pero la compatibilidad se puede lograr reconociendo las fortalezas de ambas partes. La investigación histórica no puede ser exclusivamente el procesamiento algorítmico de grandes conjuntos de datos, sin importar cuán sofisticados sean o serán los métodos.21 También necesita una investigación basada en la interpretación crítica de información híbrida de fuentes múltiples y variadas.

Por supuesto, la historia digital crea dilemas de investigación, especialmente sobre el equilibrio entre los métodos digitales y la interpretación histórica. La investigación histórica digital a menudo se concentra en las posibilidades tecnológicas y la astucia de las herramientas digitales como tales.22 Esto crea implícitamente un nuevo paradigma dominante sobre la historia que debe entenderse no como un conjunto de fenómenos sociales y culturales únicos determinados en gran medida por la distinción, la desviación y la coincidencia, sino como una cultura cohesiva que puede entenderse simplemente mediante el uso de algoritmos sagaces y presentar los resultados en espectaculares ‘visualizaciones de conmoción y asombro’.23 Los analistas de datos también reconocen que’ existe el riesgo de que miremos más detenidamente los componentes técnicos de los conjuntos de datos que el contexto histórico de la información que representan. 24

Pero la historia digital es más que eso. Dado que la creciente importancia de la comunicación digital y las fuentes históricas digitalizadas a partir de los años noventa, el interés por lo que esto significa para las ciencias históricas obviamente está creciendo.25 Si se observan los resultados prácticos de la historia digital, se debería decir que las expectativas acerca de «una revolución» no deberían ser demasiado altas. La mayoría de los historiadores todavía ven el mundo digital como un lugar conveniente para una navegación rápida y eficiente en las ricas fuentes de información disponibles y no como un entorno vital para el análisis histórico. A veces, la historia digital se considera un esfuerzo por darle significado a la historia en un nuevo entorno y crear debates históricos interactivos en Internet. Característicamente, uno de los primeros libros dedicados a la historia digital, que data de 2006, se centró en «Reunir, preservar y presentar el pasado en la Web» 26.

Aún son escasos los historiadores que exploren seriamente las posibilidades de analizar datos históricos digitales e integrar resultados en un debate histórico más amplio. La razón de esto puede ser la necesidad apremiante de comprender la naturaleza del big data y las muchas técnicas y herramientas para el almacenamiento y análisis de datos, como la minería de texto, el modelado de temas y conceptos, el análisis de redes y las visualizaciones a «macroscopio » es necesario para que un historiador se familiarice con estos datos, técnicas, métodos y herramientas.27


La gran pregunta aquí es hasta qué punto los historiadores necesitan comprender el software y las técnicas digitales. ¿Están lo suficientemente alfabetizados digitalmente para esta tarea? Por supuesto, cada esfuerzo de investigación específico requiere una comprensión profunda de los métodos utilizados para entregar respuestas, pero la comprensión completa de los métodos digitales es un desafío para los estudiosos de humanidades porque requiere un conocimiento especializado de modelos estadísticos, lenguajes de programación y la forma en que se utilizan los algoritmos para la «minería de datos». Este conocimiento generalmente está restringido a los internos; para la mayoría de los historiadores, el conocimiento computacional y el software necesarios es un paso demasiado lejos y el aspecto técnico de la recopilación de datos sigue siendo un proceso de caja negra que es difícil de evaluar.28 Debido a su conocimiento insuficiente de la lógica algorítmica que impulsa estos procesos de caja negra, los historiadores corren el riesgo de hacer ellos mismos dependen de una lógica computacional que no comprenden completamente, teniendo que depender de profesionales en campos indiferentes y a menudo distantes, como la lingüística computacional, la información y las ciencias de la computación, quienes, a su vez, carecen de la experiencia específica del dominio que los historiadores aportan a la mesa.29

Otra cuestión a la que se enfrentan los historiadores es si podemos entender la historia con solo mirar y analizar las fuentes digitales. Para comprender nuestra cultura contemporánea predominantemente digital, no se puede negar la importancia indispensable de las fuentes nacidas digitalmente. Pero, ¿qué pasa con la historia que se crea en formas analógicas, como la escritura a mano, los manuscritos, la impresión y el material audiovisual analógico? Por supuesto, se puede decir que el problema se resolverá cuando se digitalicen estos formularios, pero ese momento aún está lejos. Como veremos en la revisión de la investigación de los periódicos digitales, la falta de fuentes históricas digitales puede ser un problema real, que debe abordarse sobre la base de la crítica clásica de las fuentes: la necesidad de evaluar el alcance y las restricciones que las fuentes relevantes (o la falta de ellas que se tienen) oferta para responder preguntas específicas de investigación histórica.

A este respecto, es de suma importancia reconocer que la mayoría de las fuentes de archivo aún no están digitalizadas y no se digitalizarán ni se pondrán a disposición del público en las próximas décadas debido a los enormes costos y problemas de derechos de autor. Por lo tanto, depender únicamente del análisis digital tiene un alcance demasiado limitado e incluso peligroso porque alimenta la idea de que solo la información que está disponible instantáneamente en línea es relevante. Eso crea «pereza digital», que es una amenaza directa a la necesidad histórica de evaluar críticamente todas las fuentes sobrevivientes relevantes y no solo las disponibles digitalmente. En este tipo de evaluación es necesario el reconocimiento constante de que cada fuente solo da una imagen muy específica de la realidad histórica.30 La importancia y relevancia de esto se proporciona en la investigación que muestra la sensibilidad de los investigadores históricos de los medios para la disponibilidad de datos y herramientas. Las preguntas y estrategias de investigación pueden cambiar de manera fundamental en esta «investigación basada en datos».31 Si los datos no están disponibles digitalmente, simplemente se convierten en datos que sí lo están y se ajustan a las preguntas en este entorno.

Esto también nos dirige al problema de una infraestructura digital distinta y debidamente facilitada para realizar la investigación histórica digital. Ya se han recopilado enormes conjuntos de datos históricos digitales en archivos de datos, a veces junto con herramientas digitales para analizar los datos. Sobre esta base, se han puesto en marcha proyectos de investigación que, en general, reúnen a historiadores con informáticos. Este esfuerzo de investigación no parece estar enraizado en una necesidad urgente de diferentes puntos de vista sobre la historia, sino en la conciencia de que los datos digitales y el software están guiando cada vez más nuestro mundo contemporáneo y, por lo tanto, también pueden ser decisivos para el conocimiento y la comprensión histórica. O como escribió Lev Manovich sobre la ‘cultura softwarised’: ‘el software juega un papel central en la configuración tanto de los elementos materiales como de muchas de las estructuras inmateriales que en conjunto componen la cultura’32. Si es cierto que lo digital está determinando nuestra cultura contemporánea, también es determinante. cómo deberíamos realizar la investigación histórica.

La estrecha cooperación de especialistas en ambos campos es la solución obvia, pero en general, las técnicas digitales dominan muchas de las cooperaciones actuales. Quizás eso sea lógico debido a los muchos problemas técnicos que deben resolverse, pero los historiadores también tienen problemas importantes que resolver. Aunque los verdaderos esfuerzos de investigación interdisciplinaria aún se encuentran en el comienzo mismo del desarrollo, el uso combinado de fuentes históricas digitales y almacenadas de manera más tradicional se ha convertido en una parte más o menos normal del campo histórico profesional. Por lo tanto, los grandes desafíos no solo residen en el análisis de las fuentes digitales, sino en desarrollar una actitud profesional como historiador en el mundo digital.33

Un giro digital en la historia de los periódicos

¿Cómo se desarrolló la investigación histórica de los medios, especialmente la investigación de los periódicos, en esta infraestructura digital emergente? Para obtener una respuesta, debemos volver al «giro cultural» en la historia de los medios de comunicación desde los años ochenta. Como se mencionó anteriormente, el enfoque de la investigación pasó de la historia del trasfondo institucional y político de las instituciones de los medios al significado cultural del contenido de los medios para el público.34 En este sentido, la disponibilidad de fuentes de contenido como periódicos, películas y programas de radiodifusión era cada vez más vital. Los métodos para analizar este contenido también lo fueron.

Tradicionalmente, ya se había acumulado mucha experiencia en el análisis de contenido de medios históricos. En el análisis de periódicos históricos, por ejemplo, se desarrollaron enfoques personalizados en el contexto de cada investigación específica. El historiador de medios Frank van Vree, por ejemplo, analizó el contenido de nuestros principales periódicos holandeses en relación con su actitud hacia la Alemania nazi entre 1933 y 1939. Las secciones sobre el contexto histórico de la prensa en este período son tan largas como la investigación de contenido real que se puede caracterizar como un análisis del discurso histórico centrándose fuertemente en artículos de opinión e historias de fondo en los cuatro periódicos. Debido al trabajo intensivo de este tipo de análisis, no se pudo incluir todo el contenido de los periódicos. Tampoco se pudieron incluir secciones vitales de la prensa holandesa en este período, como la prensa nacional neutral o regional. Por lo tanto, pueden plantearse preguntas sobre la representatividad de esta investigación para la interpretación de la « opinión pública ». 35 En un estudio posterior sobre la transformación cultural del principal periódico nacional De volkskrant en los años sesenta y setenta, el enfoque de Van Vree también se limitó a ciertas secciones cuidadosamente seleccionadas. del periódico. En estudios comparables de desarrollos similares en periódicos, las mismas restricciones fueron características de la investigación 36.

Más recientemente, se han desarrollado métodos en la investigación de periódicos históricos para observar de manera más sistemática el desarrollo a largo plazo de las prácticas o géneros periodísticos. En los Países Bajos, el historiador de medios Marcel Broersma inició esta investigación haciendo un análisis longitudinal del contenido de un periódico durante 250 años. El análisis de estilo y género se integró en una investigación completamente contextualizada del desarrollo institucional y político de este periódico.37 Siguiendo las mismas líneas, pero con más énfasis en un solo género dentro de varios periódicos (internacionales), fue la investigación de Frank Harbers, quien analizó el desarrollo del reportaje en varios periódicos (internacionales). periódicos de Gran Bretaña, los Países Bajos y Francia entre 1880 y 2005. Rutger de Graaf también empleó un análisis de contenido cuantitativo para reconstruir las conexiones intertextuales entre el contenido de los folletos y los periódicos en la sociedad holandesa del siglo XIX.38

El objetivo principal de estos estudios no fue analizar datos digitales, sino arrojar luz sobre las tendencias a largo plazo en el contenido de los periódicos en relación con el desarrollo social y político. Los datos en sí se recopilaron principalmente mediante la realización manual de un análisis de contenido cuantitativo a gran escala, utilizando esquemas de codificación específicos y probando la concordancia entre codificadores para garantizar la confiabilidad de la investigación. La ventaja de estos métodos es que la codificación está diseñada para responder preguntas históricas muy específicas. La desventaja era, por supuesto, la cantidad todavía limitada de material de investigación que podía examinarse y el riesgo de subjetividad de las decisiones de codificación.

En términos generales, solo se tomaron muestras cada diez o veinte años, por ejemplo, dos semanas construidas para representar un año de muestra particular. Mientras no exista un método sólido para automatizar la búsqueda de entidades históricas específicas y complejas como «reportaje» o «artículo de comentario», seguirá siendo necesaria una investigación realizada manualmente que se base en muestras más pequeñas del material de investigación.

La tradición cultural e interpretativa en la historia de los periódicos muestra el valor de la investigación textual, pero también la importancia crítica de la contextualización de este tipo de investigación. Centrarse estrictamente en el texto en sí puede ser muy útil, en estudios lingüísticos por ejemplo, pero en la historia de los medios el contexto es indispensable para una interpretación significativa del pasado. En el entorno digital, esto también es crucial. Un ejemplo de la necesidad de contextualizar las preguntas de la investigación digital se muestra en un estudio exploratorio del concepto teórico de «pilarización» en la historia holandesa. Un proyecto de investigación llamado «Verrijkt Koninkrijk» tenía como objetivo analizar los textos digitales del historiador Loe de Jong en relación con la «pilarización», un proceso a largo plazo de segmentación social y política característico de la cultura holandesa aproximadamente entre 1900 y la década de 1960. Demostró que De Jong, en su libro de catorce volúmenes sobre los Países Bajos durante la Segunda Guerra Mundial, no escribió sobre conceptos como ‘zuilen’ (pilares) y ‘verzuiling’ (pilarización), sino que se refirió a conceptos relacionados como ‘volksdelen’ (secciones del comunidad). Los investigadores también encontraron que estas palabras no se usaban con las mismas y uniformes connotaciones. Por tanto, se debían desarrollar consultas alternativas, teniendo en cuenta que pilar es un concepto amplio con diferentes significados en diferentes niveles. Para controlar eso, es necesaria una investigación contextualizada. Un investigador también debe observar el sentimiento en el que se utilizaron los conceptos más detallados. Todo esto requiere suficiente experiencia histórica para enmarcar el problema en proporciones históricamente correctas y experiencia digital para producir métodos y herramientas de búsqueda sofisticados.39

Para la investigación de periódicos, los enfoques digitales parecen ofrecer más posibilidades que los métodos « antiguos y analógicos », como navegar selectivamente a través de los periódicos, leer algunos contenidos seleccionados y relevantes e interpretarlos en relación con otras fuentes de conocimiento histórico. manera, brinda oportunidades para ver el contexto histórico del contenido del periódico con mayor claridad. Por lo tanto, cualquier sugerencia de que la investigación de la historia digital se puede realizar mejor en un entorno digital cerrado con los macrodatos como única fuente, sería un malentendido del valor de las formas de investigación «analógicas» como la navegación y el análisis en profundidad de fuentes singulares.40

Sin lugar a dudas, los nuevos métodos de extracción de texto y datos son prometedores, ya que pueden superar algunas limitaciones de navegación manual. En principio, todos los textos están disponibles para un análisis rápido asistido por computadora, ya no dependen de la indexación o la codificación y con posibilidades de combinaciones ilimitadas de búsquedas de palabras clave.41 Las expectativas a veces son tan altas que historiadores como Joris van Eijnatten argumentan que ‘la navegación manual y el muestreo en varias formas (… ) ya no son necesarios ». 42 Sin embargo, el mismo autor también arroja dudas sobre estas expectativas al concluir que «las técnicas de minería de texto desplazarán pero no reemplazarán a los métodos hermenéuticos tradicionales ». 43

Eso puede ser reconfortante para los tradicionalistas, pero sobre todo acentúa que la historia digital llegó para quedarse. Casi todos los historiadores que trabajan con fuentes de medios históricos coinciden en que el mayor potencial de trabajar con fuentes digitales radica en reconstruir conexiones a largo plazo entre contenidos que hasta ahora no podían conectarse. Las nuevas técnicas de software para la minería de datos históricos facilitan a los historiadores que buscan patrones en grandes cantidades de textos como periódicos. Un ejemplo ofrece un análisis de contenido de millones de artículos publicados en revistas británicas desde 1800 con el objetivo de detectar eventos específicos, como guerras, epidemias, coronaciones o cónclaves.44 Con el uso de técnicas refinadas de inteligencia artificial, los investigadores pudieron ir más allá de contar palabras al detectar referencias a nombres de identidad. Estas técnicas mostraron tanto una subrepresentación sistemática como un aumento constante de las mujeres en las noticias durante el siglo XX y el cambio de enfoque geográfico de varios conceptos. También pudieron detectar las fechas en que la electricidad superó al vapor y los trenes superaron a los caballos como medio de transporte, ambos alrededor del año 1900, además de observar otras transiciones culturales.

Un ejemplo lo ofrece el proyecto de investigación ‘Transatlantis’ de la Universidad de Utrecht, que mapea los debates sobre la supuesta americanización de la cultura europea en el siglo XX. El concepto teórico utilizado en esta investigación es ‘cultura de referencia’, definida como ‘culturas identificables espacial y temporalmente que ofrecen un modelo a otras culturas y han ejercido una profunda influencia en la historia’. Este concepto se investiga en un conjunto de fuentes históricas digitales como los periódicos, creando una red de referencias a los Estados Unidos en los Países Bajos entre 1890 y 1990.45

Trazar «patrones» como este es de hecho un objetivo de la investigación en humanidades digitales en general. Pero la mayoría de los investigadores históricos enfatizan que estos patrones solo adquieren un significado real si se combinan con la investigación contextualizada, por ejemplo, la interpretación cualitativa de textos, palabras o visuales específicos. Con la investigación de los periódicos digitales podemos rastrear el desarrollo y la intensidad de eventos y personas influyentes, pero para la interpretación de cómo se realizaron estas construcciones en diferentes períodos, debemos observar más de cerca el contenido en su contexto mediático y cultural.

Para hacer el problema más concreto a nivel internacional: con las fuentes de los periódicos digitales podemos rastrear la cobertura periodística completa del asunto Dreyfus en la sociedad francesa en el siglo XX (suponiendo que todos los periódicos estén digitalizados, que no es el caso). Sin embargo, para decir algo sobre cómo este evento se redefinió constantemente en diferentes contextos, necesitamos mirar los periódicos individuales en conexión con un contexto cultural y político amplio de su tiempo. Para esto también necesitamos investigación digital, porque puede permitirnos acercarnos a contenido que, de manera tradicional, solo se podía encontrar navegando por los periódicos o viendo muchas horas de material de transmisión.

Poner la teoría en práctica: oportunidades, desafíos y problemas

La investigación de periódicos históricos ofrece una visión relevante de los problemas prácticos y metodológicos de la historia digital. Las crecientes colecciones digitales de periódicos en todo el mundo prometen mucho, pero la experiencia en el análisis del contenido de los periódicos en la investigación histórica también nos enfrenta a problemas prácticos que no pueden resolverse fácil e inmediatamente.

En primer lugar, hay que destacar que no existe un almacenamiento totalmente centralizado de todos los periódicos digitales a nivel nacional, ni siquiera en países con una poderosa infraestructura bibliotecaria nacional, como la mayoría de los países de Europa occidental. En estos países, las colecciones están en manos de instituciones nacionales, como British Newspaper Archive (suscripción), Library ofCongress (gratuita), ProQuest Historical Newspapers and Newspaper Archive Library Edition (suscripción), la colección Delpher de la Biblioteca Nacional de los Países Bajos (gratuita). ), Zefys de la Staatsbibliothek de Berlín (gratis), Gallica de Bibliothèque Nationale de France (gratis) y la colección Trove de la Biblioteca Nacional de Australia (gratis).

Junto a estos grandes archivos de periódicos digitales surgen en el mundo online todo tipo de colecciones especializadas –regionales, locales, temáticas–. Cada una de estas colecciones puede hacer uso de interfaces, estándares y / o tarifas específicas para la accesibilidad y el uso. La mayoría de ellos son financiados con fondos públicos; algunas son iniciativas privadas que pueden alcanzar una alta calidad de servicios. La «Biblioteca digital de historia de los medios», con sede en Estados Unidos, por ejemplo, digitaliza y aloja el acceso total y gratuito a colecciones completas de publicaciones periódicas de medios clásicos, principalmente revistas sobre técnicas y políticas de radiodifusión, cine y comunicación. Esta biblioteca en línea cuenta con el apoyo de propietarios que prestan sus revistas para escanear. Los donantes voluntarios aportan los fondos para cubrir el costo del escaneo46.

Debido a que no existe una regla estandarizada para agregar metadatos en estos procesos de digitalización, las conexiones entre los conjuntos de metadatos de todas estas colecciones separadas son difíciles de establecer, lo que complica los métodos de búsqueda digital realmente nuevos, como la minería de texto y el análisis de redes. Además de eso, algunas colecciones importantes como la base de datos comercial Lexis-Nexis AcademicNewspaper se basan solo en texto y, por lo tanto, ignoran totalmente la dimensión visual de las noticias, un problema fundamental para ciertas preguntas de investigación.47

Ese problema es comparable a otros problemas que rodean el análisis estadístico de los datos digitales detrás del propio periódico. Estos metadatos, que contienen todas las palabras, etiquetas, fechas, títulos y otros fragmentos de información relevantes, también se utilizan para realizar segmentaciones en los periódicos, por ejemplo, a partir de artículos, elementos visuales, publirreportajes, etc. Los metadatos y la segmentación pueden ser la base del análisis estadístico. Pero para ello los datos deben ser uniformes, cuantificables y preferiblemente también completos. La uniformidad y la calculabilidad no se pueden garantizar en motores de búsqueda públicos como Delpher, Zefys, Gallica y Trove. Estos motores de búsqueda están diseñados para consultas de búsqueda relativamente simples y para hacer conexiones entre el contenido de periódicos, revistas, revistas y, en algunos casos, incluso en libros. Parece que ya están hechos para investigar «patrones» complejos e interrelacionados a largo plazo.48

Pero para hacer cálculos estadísticos no son muy adecuados. Para el análisis estadístico, los metadatos detrás de los motores de búsqueda pueden ser útiles, pero en la mayoría de los casos los metadatos no son de acceso público. Por motivos de investigación, a veces se pueden consultar si se solicitan. Pero más conveniente sería una infraestructura especialmente diseñada para la investigación. Preferiblemente, todas las instituciones patrimoniales que tienen colecciones históricas mediáticas cooperarían en esta infraestructura. Un buen ejemplo, pero aún experimental, es ‘Europeana Newspapers’, un proyecto de dieciocho bibliotecas europeas que crean versiones de texto completo de unos diez millones de páginas de periódicos.49 También detecta y etiqueta millones de artículos individuales con metadatos y entidades con nombre (información que identifica a personas, ubicaciones). etcétera).

Este tipo de proyectos ofrece ventajas en el desarrollo de herramientas útiles y experiencia en las colecciones en sí, pero a la larga también pueden brindar oportunidades para conectar bases de datos de diferentes orígenes. Para arrojar algo de luz sobre el desarrollo histórico de los espacios públicos, por ejemplo, uno puede imaginar que necesitamos conectar el contenido de revistas periodísticas, periódicos, radio y televisión con otras fuentes de la realidad, como actas del parlamento, revistas generales, publicaciones científicas y revistas de interés especial, películas, libros y contenido de nuevos medios.

Junto a este problema general de infraestructura (que realmente debe resolverse para mejorar el valor de la investigación histórica de los medios digitales), los problemas prácticos requieren soluciones. En primer lugar, y más importante, está el problema de la incompletitud. La digitalización de fuentes y la preservación de fuentes originales (analógicas) conllevan costos considerables. Por tanto, realizar versiones digitales completas de fuentes analógicas requiere mucho tiempo. Desde principios del siglo XXI se han iniciado grandes proyectos de digitalización de colecciones de periódicos. La Biblioteca Nacional de los Países Bajos, por ejemplo, ha invertido en un proyecto con el objetivo de digitalizar todos los periódicos de su enorme colección que abarca el período comprendido entre 1618 y 2000. En 2015, se digitalizaron más de nueve millones de páginas con 1700 títulos de periódicos y aproximadamente ochenta millones de artículos ( Figura 1). Estas cifras son impresionantes, pero aún se cubre solo el quince por ciento de la colección total de periódicos. Con el ochenta y cinco por ciento aún por terminar, digitalizar todos los periódicos es de hecho un proyecto a largo plazo.50

Obviamente, con la colección de periódicos digitales ahora disponible, se pueden ver grandes lagunas. Si bien las cifras de circulación de la prensa holandesa muestran un crecimiento considerable entre 1945 y 2000, en contraste con la colección digital se observa un descenso considerable. La razón es que los títulos de periódicos de menos de setenta años solo pueden digitalizarse y hacerse accesibles al público con el permiso de los titulares de los derechos de autor. Las consecuencias se muestran en la figura 1. Para el período posterior a 1945, la mayoría de los periódicos no están disponibles públicamente para la investigación digital. Se puede decir que estamos ante un enorme agujero negro en la colección digital de periódicos históricos. Desde un punto de vista histórico, evitar este problema centrándose en los periódicos disponibles puede ser una solución irresponsable e injustificable, enfatizando la necesidad de que los investigadores que trabajan con estas colecciones demuestren siempre su responsabilidad y la conciencia de que básicamente están trabajando con una «muestra de conveniencia».

La profundidad de este problema de incompletitud se demostró concretamente en el proyecto de investigación histórica « Pilarización y depilarización probada en fuentes históricas de medios digitalizados » (Pidemehs) .51 Las universidades de Groningen y Amsterdam llevaron a cabo este proyecto entre 2014 y 2016, en estrecha cooperación con el eScienceCentre de los Países Bajos, el Biblioteca Nacional de los Países Bajos y NIAS. Su objetivo era reconstruir patrones a largo plazo en la relación histórica de la cultura política y periodística holandesa sobre la base de colecciones de periódicos digitales disponibles y fuentes políticas digitales, como programas de partidos políticos y procedimientos del parlamento. La presentación de los resultados se publicará próximamente, por lo que aquí solo se presentan algunos hallazgos sobre la práctica de la investigación.

Pidemehs mostró en primer lugar la necesidad de una preparación minuciosa (incluida la evaluación de fuentes críticas) y el control de las consultas de búsqueda digital sobre la base de la investigación histórica contextualizada. Antes de iniciar una investigación histórica de este tipo en los periódicos digitales, se debió considerar la naturaleza de las fuentes de datos digitales. ¿De qué manera y con qué profundidad se construyen, ensamblan o almacenan estos datos y cuán representativos son para el total de fuentes periodísticas producidas en ciertos períodos? Una cuestión importante relacionada con esto es qué metadatos están conectados a los datos y cómo estos datos se relacionan con la segmentación automatizada del contenido del periódico en artículos, imágenes, publirreportajes, etcétera.

El proyecto mostró las enormes limitaciones creadas por la relativa escasez de fuentes digitales, lagunas en las colecciones y fallas técnicas relacionadas con el proceso de digitalización. Estos problemas limitaron la investigación al período en el que se podía garantizar un conjunto representativo y relevante de periódicos digitales: 1918-1967. La configuración original que se extendió desde el período hasta 2000, fue imposible de realizar debido a problemas de derechos de autor.

La disponibilidad o falta de títulos de periódicos digitales demostró ser vital para abordar ciertas preguntas de investigación dentro del proyecto Pidemehs. Para un análisis de la relación a largo plazo entre el contenido de los periódicos y la identidad política, por ejemplo, se necesitaban copias digitales de los periódicos que fueran conocidos por su identidad política o religiosa y aquellos que se llamaran a sí mismos «neutrales» o «no partidistas». Parecía que ambos podrían faltar. En la colección de periódicos de la Biblioteca Nacional de los Países Bajos, por ejemplo, no se conserva ningún juego digital completo del periódico protestante más importante entre 1870 y 1940 –De standaard–, probablemente por falta de dinero para digitalizar el juego completo. Además, en el momento de en este proyecto de investigación faltaba un conjunto completo de periódicos liberales como NRC y Algemeen handelsblad; Solo ciertas partes de los años de entreguerras se digitalizan y se hacen accesibles.53 De manera similar, en ese momento, una copia digital del periódico católico más importante De volkskrant desde 1919 hasta ahora no estaba disponible debido a problemas de derechos de autor.54 En general, los datos disponibles limitaban la investigación. a un análisis de los grupos y periódicos socialistas, católicos y neutrales.

La insuficiencia de los datos disponibles es el mayor problema práctico, pero no el único. La falta de uniformidad en los datos es otra. La minería de datos históricos eficaz se basa en datos uniformes. Por ejemplo, si está buscando la intensidad de la atención de los periódicos para un partido político llamado RKSP, ¿cómo puede estar seguro de que recuperará todos los datos relevantes? Un problema es que los periódicos no tienen la costumbre de estandarizar nombres y conceptos, por lo que una consulta de búsqueda debe incluir todas las variedades de nombres. Basándose en el conocimiento de la experiencia sobre la historia política y la documentación existente de los partidos políticos, se puede hacer una lista con todas las variedades que el partido RKSP (y su predecesor) utilizó en un período entre 1918 y 1940. Esa lista se ve así: «ABRKKV; BRKKV; Algemeene Bond van Rooms-Katholieke Kiesvereenigingen; Bond van KatholiekeKiesvereenigingen; Katholieke Kiezersbond; R.K.S.P .; RKSP; Roomsch-Katholieke Staats-Partij; Rooms-Katholieke Staatspartij; Katholieke Staatspartij; kath. Staatspartij; R.K. Staatspartij, onzeStaatspartij, onze partij ’. Se siguió el mismo procedimiento en relación con los nombres de otras partes.

La búsqueda de nombres de personas (políticos destacados en este caso) puede crear el desafiante problema de cómo aislar exactamente a una persona relevante y excluir a las personas que llevan el mismo nombre. Trabajar con búsquedas que combinen el nombre con la proximidad de nombres, títulos o conceptos relevantes (líder del partido, primer ministro, político, etc.) puede ayudar, pero esto requiere algunas operaciones de prueba y error realizadas con cuidado. Todo enfatiza la importancia del conocimiento especializado del contexto necesario al realizar este tipo de investigación de periódicos históricos digitales.

Al reconstruir la relación histórica de personajes políticos prominentes (ministros, líderes de partidos, etc.) con el contenido de los periódicos en el proyecto Pidemehs, se muestra que la restricción a la cantidad de menciones a estas personas en los periódicos plantea interrogantes. En el contexto holandés, encontrará que los políticos que dominan un período distinto como los años de entreguerras (Colijn, DeGeer) o los años cincuenta (Drees, Romme) se mencionan más que el promedio, no solo en la prensa que es leal a sus políticas. Eso da una clara indicación de que la pillarización no es solo una cuestión de lealtad restringida dentro del propio grupo ideológico; también se trata de la necesidad de un competidor o enemigo. Esto exige una investigación más cualitativa sobre la forma en que se representa a los políticos en determinados contenidos de los periódicos. Esto también se puede investigar digitalmente, utilizando técnicas de minería de sentimientos.

Lo anterior demuestra que para excavar eficientemente en big data se necesitan herramientas que solo los ingenieros de datos altamente calificados pueden usar o desarrollar. Aquí es vital una estrecha cooperación con especialistas en idiomas y / o historiadores.55 Las instituciones del patrimonio pueden tener un papel en el desarrollo de tales herramientas para analizar sus colecciones digitales en cooperación con universidades e institutos de investigación. Por ejemplo, se ha acumulado cierta experiencia con tecnología de minería de código abierto en la investigación de periódicos históricos. En los programas históricos de «minería de sentimientos», las nubes de palabras WAHSP y BILAND se crean basándose en frecuencias relativas en la selección de documentos recuperados en el corpus. Una nube de palabras puede resaltar una connotación negativa o positiva, pero esto aún necesita una mayor contextualización histórica porque la connotación cambia constantemente con el tiempo.56 Una herramienta como Texcavator, desarrollada por la Universidad de Utrecht y el Centro de eScience de los Países Bajos para rastrear patrones en el discurso público, también está lidiando con este problema..57 El desarrollo de métodos de búsqueda digital complejos y personalizados que puedan abordar problemas específicos constituye uno de los grandes desafíos de la historia de los medios digitales. Esto es especialmente válido para el problema de cómo recuperar y analizar elementos visuales o icónicos dentro de los periódicos, como fotografías, dibujos animados, mapas y gráficos. La búsqueda de la proliferación de fotografías icónicas en los debates públicos, por ejemplo, acaba de comenzar.

‘Pidemehs’ y otros proyectos de humanidades digitales muestran cómo los problemas de derechos de autor pueden crear graves limitaciones de uso, especialmente para los periódicos de finales del siglo XX. La recuperación y la consulta en un entorno de investigación protegido (utilizando un servidor proxy, por ejemplo) pueden ofrecer una solución, pero luego la publicación de resultados en un entorno de acceso abierto puede volverse problemática. Si los académicos solo pueden leer sobre los resultados sin la posibilidad de comprobarlos y verificarlos en los datos originales de la investigación, la rutina histórica científica se ve amenazada.

Esto no significa que se alcance la integridad y accesibilidad total de los periódicos que datan del período anterior a la rotonda de 1940. En los procesos de digitalización de los periódicos se han realizado selecciones de prioridad, generalmente sobre la base de los consejos dados por los investigadores. . Investigaciones especializadas han demostrado que incluso en el siglo XVII, donde los problemas de derechos de autor no son un problema y la cantidad total de periódicos es relativamente pequeña, el cincuenta y dos por ciento de todos los periódicos impresos que han sobrevivido entre 1618 y 1650 están « perdidos en la digitalización ». De las 750 copias que se conservan del periódico holandés más antiguo, el Courante uyt Italien, Duytschlandt & c publicado por Jan van Hilten, hasta ahora solo 199 copias han sido digitalizadas y accesibles al público en Delpher.59

Necesita conocimientos históricos de expertos para comprender la profundidad de este problema y posiblemente crear soluciones. Pero mantener la experiencia sobre el contexto de las fuentes originales y el manejo de los portadores digitales no solo cuesta mucho dinero, sino que también requiere comprender la relación del periódico analógico original y la forma digital. ‘Cuando digitalizamos un periódico, cambia fundamentalmente (…) las fuentes se remedian y no solo se reproducen’, comentó acertadamente el historiador Bob Nicholson60. Los informes de noticias, por ejemplo, facilitan considerablemente la investigación, pero estas etiquetas pueden ser anacrónicas porque la connotación de este tipo de conceptos cambia con el tiempo.

Esta conciencia de la fuente histórica está creciendo de manera constante. Entonces, tal vez el problema del costo sea más apremiante. ¿Quién pagará la digitalización de todos los periódicos? En general, solo se puede decir que la creación de instalaciones para la investigación científica en Europa Occidental se financia, en principio, con fondos públicos. Pero el interés público choca claramente con los intereses privados en el tema de los derechos de autor. Y el problema de los derechos de autor es realmente decisivo por la falta de exhaustividad de las fuentes históricas de los medios del siglo XX, como periódicos, revistas, películas y material de radiodifusión.

Además de lo incompleto en la cantidad, también se crean problemas debido a errores de OCR. Aún no está claro cuán estable y precisa es la tecnología de los portadores digitales, pero la experiencia en proyectos digitales muestra claramente una falta de fiabilidad en la relación del análogo original y el nuevo portador digital. La precisión y la calidad del reconocimiento óptico de caracteres (OCR) en los documentos escaneados pueden influir seriamente en la segmentación y la cantidad de errores en las posibilidades de búsqueda digital, especialmente en documentos que requieren conocimientos especializados para leer o interpretar.61 Los errores de OCR son, por ejemplo, un problema especial. en casi todos los textos producidos antes de 1850, debido a la inconsistencia en la forma tipográfica y el diseño en los períodos más antiguos.62

Se pueden ver las consecuencias en la colección digitalizada de periódicos históricos en la Biblioteca Nacional de los Países Bajos. Se muestra que el nivel de precisión del OCR aumenta considerablemente con el tiempo: cuanto más antiguo es el portador original, más errores contiene. Se estima que esto puede llegar hasta más del ochenta por ciento para algunos periódicos de los siglos XVII y XVIII que tienen características de diseño peculiares o utilizan fuentes únicas. Para los periódicos del siglo XVII con un diseño regular con letras góticas y diseño de texto vertical, la tasa de fallas se estima entre el quince y el veinte por ciento.63

No es absoluto decir que la tasa de fallos en los periódicos con letras y diseños modernos y estandarizados sea insignificante o incluso inexistente. Una búsqueda del uso de una palabra holandesa relativamente nueva como «verzuiling» (pilarización) en periódicos históricos lo demuestra. La investigación del contexto histórico ha demostrado que «verzuiling» se desarrolló como un concepto para interpretar la cultura política holandesa en los años cincuenta del siglo XX. Pero este neologismo aparece dos veces en los periódicos holandeses del siglo XVIII disponibles a través del motor de búsqueda Delpher de la Biblioteca Nacional de los Países Bajos. En el siglo XIX, treinta y tres resultados aparecen como «desviados», mientras que en los periódicos originales se mencionan: verzameling, vervulling, verzetting, verzoeking, verzoening, verzorging, vergoding y verzanding. En el período del siglo XX antes del primer uso adecuado de «verzuiling» en 1952, aparecen más de treinta y cinco errores de OCR.

Carolyn Strange y otros historiadores de la prensa estadounidense también señalan errores de OCR y otros obstáculos técnicos en su investigación histórica, como la falta de metadatos expertos a nivel de documentos en periódicos estadounidenses históricos. Su conclusión, sobre la base de una selección claramente delineada de la investigación de los periódicos del siglo XIX, es que la corrección de las fallas de OCR (en su conjunto de datos: alrededor del veinte por ciento) es ‘deseable pero no esencial’ en este tipo de investigación de actualidad, suponiendo que haya suficiente tiempo. para comprobar qué hacen exactamente las fallas en consultas de búsqueda específicas.64 Por supuesto, eso es diferente con tasas de fallas de más del ochenta por ciento en los periódicos más antiguos con características tipográficas peculiares. Y es diferente si el análisis estadístico es una de las herramientas de investigación, porque los programas o algoritmos estadísticos generalmente no descartan automáticamente los errores de OCR.

Existen varios métodos para la corrección de fallas de OCR, que no se pueden discutir en detalle dentro del alcance de este artículo, pero ninguno se ha desarrollado hasta ahora como una solución definitiva. Lo ideal es reducir las fallas, preferiblemente mediante una doble corrección manual o incluso mediante la contratación colectiva. El crowdsourcing es prometedor, pero a pesar del éxito de las bases de datos de conocimiento de fuentes múltiples como Wikipedia y las experiencias positivas con algunos proyectos de crowdsourcing en instituciones del patrimonio cultural, todavía existen algunas dudas sobre el valor y la confiabilidad para fines científicos.65 Los técnicos predicen que el software de autoaprendizaje puede resolver el problema a largo plazo, pero esto requiere la participación humana para «instruir» al software sobre lo que es correcto y lo que no lo es. Y aunque hay académicos que afirman que una gran cantidad de anotadores pueden producir resultados mejores y más confiables al agregar o corregir metadatos que los anotadores con conocimiento experto, los curadores de instituciones patrimoniales siguen siendo cautelosos.66

Estas instituciones todavía tienen una función intermedia vital y algunas experimentan con el aumento de la confiabilidad de los metadatos y la segmentación. El Archivo de Periódicos Británicos y la Biblioteca Nacional de Australia permiten a los usuarios corregir errores de OCR y agregar etiquetas que consideren relevantes para el artículo en cuestión.67 Junto con el Instituto Meertens, la Biblioteca Nacional de los Países Bajos trabaja con un gran grupo de voluntarios para volver a escribir los artículos. en la colección digital de periódicos del siglo XVII sobre la base de la OCR.

Conclusión

La digitalización de los periódicos históricos indudablemente ha estimulado la investigación, pero el afán por utilizar las fuentes a veces quita la conciencia de los nuevos problemas que acompañan a estos enfoques; especialmente porque el almacenamiento, la recuperación y el acceso a los datos siguen siendo muy problemáticos.68 El almacenamiento y el acceso gratuito son, por supuesto, problemas clásicos. Desde la perspectiva de la investigación histórica, la libre disponibilidad de fuentes completas y uniformes siempre ha sido vital. La infraestructura histórica que se construyó en los siglos XIX y XX es el resultado de este esfuerzo: archivos de acceso público, publicaciones fuente concisas y ampliamente anotadas, instituciones patrimoniales que custodian colecciones completas y contextualizadas y proyectos de investigación a largo plazo.

Estos esfuerzos culturales adquieren una nueva dimensión en el mundo digital. La búsqueda de soluciones adecuadas para una combinación de infraestructura fructífera de fuentes analógicas y digitales está en pleno desarrollo. Para los investigadores es necesaria la reflexión sobre el valor y el uso de las fuentes digitales. Analizar los periódicos históricos adquiere una dimensión diferente cuando lo vemos como analizar grandes datos. La navegación manual por los periódicos (en papel o mediante microfilms) se utiliza automáticamente para dar algún contexto histórico al contenido de los artículos, la posición en relación con otros contenidos, las formas culturales y los géneros mediáticos que se encuentran en estas fuentes. Sin embargo, al analizar los datos de los periódicos digitales, el investigador debe ser consciente de que está realizando una investigación descontextualizada. También conviene acostumbrarse a la idea de que la escasez de fuentes se sustituye por una abundancia relativa.69

Pero esta abundancia es relativa, porque está claro que no todas las fuentes analógicas están disponibles digitalmente. En este artículo se ha demostrado que en un entorno digital no se puede garantizar la integridad y uniformidad. Aunque se han invertido millones de euros en proyectos de digitalización, solo una fracción de los periódicos históricos son accesibles con fines de investigación. OCR y otros problemas técnicos también afectan la búsqueda de una óptima accesibilidad y aplicabilidad de las fuentes. La falta de dinero, pero también la dispersión de las colecciones y especialmente los problemas de derechos de autor siguen siendo decisivos para el éxito de los esfuerzos de investigación.70 Por lo tanto, un investigador que quiera trabajar con datos completos de periódicos debe ser capaz de organizar, improvisar y negociar. para financiar la digitalización de las fuentes necesarias, que pueden ser demasiado importantes para un solo proyecto de investigación. Por último, pero no menos importante, un investigador debe darse cuenta de que una buena preparación es más de la mitad del trabajo; es casi todo el trabajo.

La investigación histórica en periódicos digitales necesita instituciones patrimoniales bien equipadas que creen y mantengan una infraestructura eficaz. No se trata solo de almacenar y organizar datos digitales, hacerlos accesibles y desarrollar herramientas digitales de análisis. También se trata de proteger el original y mantener el conocimiento experto de todas las fuentes de los periódicos, tanto digitales como analógicos. Y se trata de hacer un esfuerzo serio para resolver el problema de los derechos de autor poniendo el interés de la consulta pública en un lugar destacado de la agenda. Por lo tanto, las instituciones del patrimonio mediático deben continuar con la digitalización de las fuentes con el objetivo final de alcanzar la completitud. Al hacer esto, deben estar constantemente conscientes de que tanto los historiadores como los científicos digitales necesitan datos completos y uniformes, pero también plantean diferentes preguntas y utilizan diferentes métodos.

Para los investigadores, plantea la cuestión de qué valor otorgan a determinados componentes de la investigación en historia digital: software y técnicas de manejo de datos, contextualizaciones, operacionalización metodológica, análisis e interpretación. Todos estos componentes deben estar en equilibrio y ser evaluados críticamente a la luz de la pregunta de investigación histórica específica. Así como las suposiciones de los historiadores que formulan preguntas de investigación no son neutrales, las suposiciones de los analistas y fabricantes de herramientas digitales tampoco lo son. «La teoría ya está trabajando en el nivel más básico cuando se trata de definir unidades de análisis, algoritmos y procedimientos de visualización» 71.

En resumen, debemos concluir que la investigación existente en humanidades digitales no puede estar a la altura de las afirmaciones de algunos estudiosos de las ciencias de la información y las humanidades digitales de que estamos experimentando una revolución. Nos enfrentamos a importantes problemas metodológicos y prácticos que deben resolverse para lograr avances convincentes en la investigación histórica, avances no estrictamente teóricos, sino en la realización de investigaciones periodísticas históricas concretas, por ejemplo. En estrecha cooperación con los académicos digitales, los historiadores de los medios deben ser capaces de conectar los desarrollos a largo plazo en las fuentes digitales con eventos históricos ejemplares. Realizar críticas de fuentes y formular preguntas sobre la base de agendas históricas son cruciales. La formulación de nuevas agendas de investigación sobre la base de fuentes digitales solo puede ser útil si se reconoce que las fuentes analógicas y el conocimiento contextualizado son vitales. Las pautas históricas tradicionales para mirar de manera cuidadosa y crítica la materialidad y el contexto histórico únicos de las fuentes y no depender de una sola fuente o método siguen siendo relevantes, probablemente más relevantes que nunca.

Notas

  1. Este texto es parte del proyecto de investigación “Pilarización y depilarización probada en fuentes históricas de medios digitalizados” (Pidemehs), realizado por la Universidad de Amsterdam y la Universidad de Groningen. El proyecto es posible gracias al generoso apoyo de la Biblioteca Nacional de los Países Bajos, el Instituto de Estudios Avanzados NIAS de los Países Bajos y el Centro de eScience de los Países Bajos.
  2. Frédéric Clavert y Serge Noiret, “Humanidades e historia digitales. Un nuevo campo para los historiadores en la era digital ”, en Historia contemporánea en la era digital, ed. Ibidem (Bruselas: Peter Lang, 2009), 15-26; ed. David M. Berry, Comprensión de las humanidades digitales (Houndmills: Palgrave Macmillan, 2012); Susan Schreibman, compañera de humanidades digitales (Malden: Blackwell, 2004)
  3. 3. Joris van Eijnatten, Toine Pieters, Jaap Verheul, “Big Data para la historia global. La promesa transformadora de las humanidades digitales ”, BMGN – Low Countries Historical Review 128, no. 4 (2013): 55–77, allí 57. El debate general sobre «los campos y disciplinas de las humanidades que flexionan lo digital» en: ed. Patrik Svensson y David Theo Goldberg Between Humanities and the Digital (Cambridge, MA: The MIT Press, 2015), para el campo histórico, especialmente págs. 17–33.
  4. 4. Bob Nicholson, “El giro digital. Explorando las posibilidades metodológicas de los archivos de periódicos digitales ”, Media History 19, no. 1 (2013): 59–73.
  5. 5. Nicholson, “El giro digital”, 63.
  6. 6. Bod, Rens, Het einde van de geesteswetenschappen 1.0. Conferencia inaugural, Universidad de Amsterdam, 14 de diciembre de 2012; “Foro: el fin de las humanidades 1.0”, BMGN – Revista histórica de los países bajos 128, no. 4 (2013): 145–180.
  7. Jim Macnamara, The 21st Century Media (R) evolution: Emergent Communication Practices (Nueva York: Lang, 2014); Jo Bardoel y Huub Wijfjes, “Journalistieke cultuur in Nederland: een professie tussen traditie entoekomst”, en Journalistieke Cultuur in Nederland, ed. Ibidem (Ámsterdam: Amsterdam University Press, 2015), 11–29.
  8. 8. Un análisis extenso de este ‘debate hiperbólico’ da: Paul Gooding, ‘¡Búscalo todo!’ Periódicos históricos en la era digital (Abingdon: Routledge, 2017), 22–48. Compare: Alan Liu, “¿Dónde está la crítica cultural en las humanidades digitales?”, En Debates in the Digital Humanities, ed. Matthew K. Gold (Minneapolis: University of Minnesota Press, 2012), 490–509; Evgeny Morozov, Para salvarlo todo, haga clic aquí: la locura del solucionismo tecnológico (NewYork: Public Affair Books, 2013); Andreas Fickers, “¿Hacia un nuevo historicismo digital? Haciendo historia en la era de la abundancia ”, Ver. Revista de Historia y Cultura de la Televisión Europea 1, no. 1 (2012), http://www.viewjournal.eu/index.php/view/article/view/jethc004/4. Andreas Fickers, “Venas llenas de la savia diluida de la racionalidad. Una respuesta crítica a Rens Bod ”, BMGN – Revisión histórica de los países bajos 128, no. 4 (2013): 155–163.
  9. 9. David Armitage y Jo Guldi The History Manifesto (Cambridge (Reino Unido): Cambridge University Press, 2014), 117.
  10. 10. Fickers, «Veins Filled»; Liu «¿Dónde está la crítica cultural» .
  11. 11. Kees Bertels, Geschiedenis tussen structuur en evenement (Amsterdam: Wetenschappelijke Uitgeverij, 1973); R.W. Fogel, «‘ Historia científica ’e‘ Historia tradicional ’”, en ¿Qué camino hacia el pasado? Dos visiones de la historia, ed. R.W.Fogel y G.R. Elton, G.R (New Haven, Nueva Jersey: Yale University Press), 7–70.
  12. 12. Hinke Piersma y Kees Ribbens, “Investigación histórica digital. Contexto, conceptos y necesidad de reflexión ”. BMGN – Revista histórica de los países bajos 128, no. 4 (2013): 78–102, allí 82–85.
  13. 13. Bernhard Rieder y Theo Röhle, “Métodos digitales: cinco desafíos”, en Understanding Digital Humanities, ed. David M. Berry (Houndmills: Palgrave Macmillan, 2012), 67–84.
  14. 14. Robert Darnton, El beso de Lamourette. Reflections in Cultural History (Nueva York: W.W. Norton, 1990), 60.Compare: Fickers, “Veins Filled” .
  15. 15. Stanley Fish, «Las humanidades digitales y la trascendencia de la mortalidad», The New York Times, 9 de enero de 2012, http://opinionator.blogs.nytimes.com/2012/01/09/the-digital-humanities-and- la-trascendencia-de-la-mortalidad /; José van Dijck, “Big data, grandes desafíos. Over digitalisering en het geesteswetenschappelijk onderzoek ”, Ketelaar-lezing 12 (2014), http://www.clariah.nl/files/publicaties/Ketelaarlezing_2014.pdf; Ted Striphas, «AlgorithmicCulture», Revista Europea de Estudios Culturales 18, no. 4–5 (2015): 395–412.
  16. 16. Fogel, “‘ Historia científica ’”; Shawn Graham, Ian Milligan y Scott Weingart, Explorando grandes datos históricos. TheHistorian’s Macroscope (Londres: Imperial College Press, 2016), 1–35. El concepto de «humanidades analógicas» en: Jonathan Stern, «El ejemplo: algunas consideraciones históricas» en Between Humanities and the Digital, ed. PatrikSvensson y David Theo Goldberg (Cambridge, MA: The MIT Press, 2015), 17–33.
  17. 17. Van Dijck, “Big Data” .
  18. 18. Huub Wijfjes, “Perspectief in persgeschiedenis”, BMGN – Revisión histórica de los países bajos. 114, no. 2 (1999): 223–235, doi: http://doi.org/10.18352/bmgn-lchr.4949; Donald G. Godfrey ed., Métodos de análisis histórico en medios electrónicos (Mahwah, Nueva Jersey: Lawrence Erlbaum, 2006); Michele Hilmes, Solo conéctate. Una historia cultural de la radiodifusión en los Estados Unidos (Belmont: Thompson Wadsworth, 2010); John Hartley, Digital Future for Culturaland Media Studies (Chichester: Wiley-Blackwell, 2012), 27–58.
  19. 19. Berry, Comprensión de las humanidades digitales, 12.
  20. 20. Ibíd.
  21. 21. Piersma y Ribbens, “Investigación histórica digital”, 57.
  22. 22. Toni Weller, “Introducción”, en Historia en la era digital, ed. Ibidem (Londres: Routledge, 2013).
  23. 23. Armitage y Guldi, Manifiesto de historia, 122.
  24. 24. Prescott, “The Deceptions of Data”, citado en: Gerben Zaagsma, “On Digital History”, BMGN – Low CountriesHistorical Review 128, no. 4 (2013): 3–29, allí 24. También: Andrew Prescott, “Una corriente eléctrica de la imaginación: qué son las humanidades digitales y en qué podrían convertirse”, Journal of Digital Humanities 1, no. 2 (2012), http://journalofdigitalhumanities.org/1-2/an-electric-current-of-the-imagination-by-andrew-prescott/.
  25. 25. Acerca de la historia de la historia y la informática, ver: Zaagsma “Sobre la historia digital” .
  26. 26. Daniel J. Cohen y Roy Rosenzweig, Historia digital. Una guía para reunir, preservar y presentar el pasado en la Web (Filadelfia: University of Pennsylvania Press, 2006)
  27. 27. Amplia exploración de estos aspectos en: Graham, Milligan y Weingart, Exploring Big Historical Data. Para las humanidades en general, un manual instructivo es: Richard Rogers, Digital Methods (Cambridge, MA: The MITPress, 2013)
  28. 28. Rieder y Röhle, “Métodos digitales”.
  29. Frank Pasquale, The Black Box Society. Los algoritmos secretos que controlan el dinero y la información (Cambridge (MA): Harvard University Press, 2015)
  30. 30. Michiel van Groesen, “Digital Gatekeeper of the Past: Delpher and the Emergence of the Press in the Dutch Golden Age”, Tijdschrift voor Tijdschriftstudies 38 (2015): 9–19, allí 17, doi: http://doi.org/10.18352 /ts.340.
  31. 31. M. Bron, J. van Gorp y M. de Rijke, “Investigación de estudios de medios en la era basada en datos: cómo evolucionan las preguntas de investigación”, Revista de la Asociación para la Ciencia y Tecnología de la Información 67, no. 7 (2016): 1535–1554, doi: http: //10.1002/asi.23458.
  32. 32. Lev Manovich, El software toma el mando (2008), 15, http://softwhestudies.com/softbook/manovich_softbook_11_20_2008.pdf
  33. 33. Zaagsma, «Sobre la historia digital», 17-18.
  34. 34. Wijfjes, “Perspectief in persgeschiedenis”; Godfrey, métodos de análisis histórico; Hilmes, Only Connect; Hartley, Digital Future
  35. 35. Frank van Vree, De Nederlandse pers en Duitsland. Un estudio sobre de vorming van de publieke opinie (Groningen: Historische Uitgeverij, 1989)
  36. 36. Frank van Vree, De metamorfose van een dagblad. Een journalistieke geschiedenis van de Volkskrant (Amsterdam: Meulenhoff, 1996); Gerard Mulder y Paul Koedijk, ¡Léés die krant! Geschiedenis van het naoorlogse Parool 1945-1970 (Amsterdam: Meulenhoff, 1996); Mariëtte Wolf, Het geheim van de Telegraaf (Ámsterdam: Boom, 2009)
  37. 37. Marcel Broersma, Beschaafde vooruitgang. De wereld van de Leeuwarder courant 1752-2002 (Leeuwarden: FriesePers, 2002) .
  38. 38. Rutger de Graaf, periodista de beweging. Veranderende berichtgeving in kranten en pamfletten (Groningen en‘s-Hertogenbosch 1813–1899) (Amsterdam: Bert Bakker, 2010); Frank Harbers, entre la experiencia personal y la información separada. The Development of Reporting and the Reportage in Gran Bretaña, los Países Bajos y Francia, 1880-2005 (disertación, Universidad de Groningen, 2014)
  39. 39. Piersma y Ribbens, “Digital Historical Research”, 91–95.
  40. 40. Marcel Broersma, “Nooit meer bladeren? Digitale krantenarchieven als bron, ”Tijdschrift voor Mediageschiedenis14, no. 2 (2011): 29–55.
  41. 41. Van Eijnatten y col. (2013), 73; Bingham, Adrian (2012). «Lectura de periódicos: Historias culturales de la prensa popular en la Gran Bretaña moderna». History Compass 10/2, 140-150. Hart, Roderick P. y Lim, Elvin T. (2015). “Seguimiento del lenguaje del espacio y el tiempo, 1948–2008” .Journal ofContemporary History 46/3, 591–609.
  42. 42. Van Eijnatten, Pieters y Verheul, “Big Data”, 73.
  43. 43. Ibíd., 75,
  44. 44. Thomas Lansdall-Welfare, Saatviga Sudhahar, James Thompson, Justin Lewis, Equipo de periódicos FindMyPast y Nello Cristianini, “Análisis de contenido de 150 años de publicaciones periódicas británicas”, PNAS 114, no. 4 (2017): 457–465; publicado en línea el 9 de enero de 2017, doi: http: //10.1073/pnas.1606380114.
  45. 45. Van Eijnatten, Pieters y Verheul, “Big Data”, 69; http: //translantis.wp.hum.uu.nl.
  46. 46. http: //mediahistoryproject.org
  47. 47. David Deacon, «Documentos de ayer y tecnología de hoy. Archivos de periódicos digitales y análisis de contenido de botones ”, European Journal of Communication 22, no. 1 (2007): 5–25; Broersma, “Nooit meer bladeren”; N. Maurantonio, “Archivar lo visual. Las promesas y las trampas de los periódicos digitales ”, Media History 20, no. 1 (2014): 88–102.
  48. 48. Maarten van den Bos y H. Giffard, “The Grapevine: Midiendo la influencia de los periódicos holandeses en Delpher”, Tijdschrift voor Tijdschriftstudies 38 (2015): 29–41, doi: http://doi.org/10.18352/ts.342.
  49. 49. http: //www.europeana-newspapers.eu.
  50. 50. Una descripción general de los títulos disponibles en esta colección de KB digital ofrece: https://www.kb.nl/sites/default/files/docs/Beschikbare_kranten_alfabetisch.pdf.
  51. 51. https://www.esciencecenter.nl/project/pidimehs.
  52. 52. La configuración técnica de Pidemehs se muestra en: P. Bos, H. Wijfjes, M. Piscaer y Voerman, «QuantifyingPillarization: Extracting Political History from Large Databases of Digitized Media Collections», en Proceedings of the3rd HistoInformatics Workshop, Cracovia, Polonia, ed. . M. Düring, A. Jatowt, J. Preiser-Kapeller y A. van den Bosch (Aquisgrán: CEUR Workshop Proceedings, 2016), 52–57, http://ceur-ws.org/Vol-1632/. Próximamente son: H. Wijfjes, G. Voerman y P. Bos, Meten van verzuilde media. Een digitale benadering van politiek en dagbladen 1918-1967.
  53. 53. Actualmente, ambos periódicos se han incorporado a las colecciones digitales de Delpher.
  54. Se espera que, a partir de agosto de 2017, De volkskrant (y otros títulos de la cartera de la empresa de medios DePersgroep) estén disponibles en Delpher.
  55. 55. Carolyn Strange, Josh Wodak e Ian Wood, “Minería en busca de los significados de un asesinato. El impacto de la calidad OCR en el uso de periódicos históricos digitalizados ”, Digital Humanities Quarterly 8, no. 1 (2014), http://www.digitalhumanities.org/dhq/vol/8/1/000168/000168.html
  56. 56. Van Eijnatten, Pieters y Verheul, “Big Data”, 61; http://biland.science.uva.nl/wahsp/.
  57. 57. Joris van Eijnatten, Toine Pieters y Jaap Verheul, “Uso de Texcavator para mapear el discurso público”, Tijdschriftvoor Tijdschriftstudies 35 (2014): 59–65; https://www.esciencecenter.nl/project/texcavator.
  58. 58. Martijn Kleppe, “¿Qué hay en la vista de la foto? Kansen en problemen bij het opzetten van een eigenfotodatabase, ”Tijdschrift voor Mediageschiedenis 14, no. 2 (2012): 73–107.
  59. 59. Van Groesen, «Digital Gatekeeper», 19.
  60. 60. Nicholson, “The Digital Turn”, 61, 64.
  61. 61. Charles Jeurgens, “El olor del archivo digital”, BMGN – Low Countries Historical Review 128, no. 4 (2013): 30–54, allí 34.
  62. 62. Thomas Smits, “Problemas y posibilidades de los archivos de periódicos y periódicos digitales”, Tijdschrift voorTijdschriftstudies 36 (2014): 139–146, allí 141.
  63. 63. Van Groesen, «Digital Gatekeeper», 17.
  64. 64. Strange, Wodak y Wood, «Mining for the Meanings» .
  65. 65. Johan Oomen y Lora Aroyo, “Crowdsourcing en el dominio del patrimonio cultural: oportunidades y desafíos”, Actas de la Quinta Conferencia Internacional sobre Comunicación y Tecnologías (Nueva York: ACM, 2011), 138–149; Daren C. Brabham, Crowdsourcing (Cambridge, MA: The MIT Press, 2013); Gregory D. Saxton, Onook Oh y Rajiv Kishore, “Rules of Crowdsourcing: Models, Issues, and Systems of Control”, InformationSystems Management 30, n. ° 1 (2013): 2–20, http://dx.doi.org /10.1080/10580530.2013.739883.
  66. 66. Lora Aroyo y Chris Welty, «La verdad es una mentira: la verdad colectiva y los siete mitos de la anotación humana», Revista de inteligencia artificial 36, no. 1 (2015): 15–24; Mia Ridge ed. Crowdsourcing de nuestro patrimonio cultural (Abingdon / Nueva York: Routledge, 2016)
  67. 67. Nicholson, «El giro digital», 64,
  68. 68. Diácono, «Documentos de ayer»; Broersma, “Nooit meer bladeren” .
  69. 69. Broersma (2011), 35–37.
  70. 70. Vgl. Karel Berkhout, «Het Digitale Drama», NRC handelsblad, 10 de septiembre de 2011.
  71. Rieder y Röhle, «Métodos digitales», 70

Huub Wijfjes

(1956) es profesor asociado de Estudios de Periodismo e Historia de los Medios en la Universidad de Groningen y profesor de Historia de la Radio y la Televisión en la Universidad de Amsterdam (departamento de Estudios de Medios). Es autor de numerosos libros y artículos sobre historia de los medios, historia política y periodismo. Escribió libros completos sobre la historia del servicio público de radiodifusión holandés: VARA, biografie van een omroep (‘VARA, biografía de una asociación de radiodifusión pública’; Amsterdam 2009, incluido un sitio web) y la historia del periodismo holandés: Journalistiek in Nederland 1850-2000 . Beroep, organisatie encultuur («Periodismo en los Países Bajos 1850-2000. Profesión, organización y cultura»; Amsterdam 2004). En 2009 editó (con G. Voerman) el volumen Mediatization of Politics in History (Peeters Leuven). En 2015 y 2016 fue investigador en el Instituto de Estudios Avanzados de los Países Bajos (NIAS) para una investigación sobre la relación histórica dinámica de la política y los periódicos en la historia holandesa moderna sobre la base de fuentes digitales.

Comenta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s