Plaza de la Alegría > #4

Los tres de ellos leen un artículo económico.
Huang Jianhua
Patrick, permíteme explicarte las partes importantes de este documento.
Patrick O'Leary
Claro, Huang. Por favor explícamelo en términos que pueda entender.
Huang Jianhua
Este documento trata sobre un conjunto de datos a gran escala de periódicos históricos de Estados Unidos llamado American Stories.
Patrick O'Leary
¿Qué significa 'conjunto de datos a gran escala'?
Huang Jianhua
Significa que hay una enorme cantidad de datos en este conjunto de datos. Contiene casi 20 millones de escaneos de periódicos.
Patrick O'Leary
¡Vaya, eso es mucho!
Huang Jianhua
Sí, lo es. Los investigadores utilizaron un pipeline de aprendizaje profundo para extraer los textos completos de los artículos de las imágenes de los periódicos.
Patrick O'Leary
¿Aprendizaje profundo? ¿Qué es eso?
Huang Jianhua
El aprendizaje profundo es un tipo de inteligencia artificial que aprende de los datos para hacer predicciones o realizar tareas.
Patrick O'Leary
Entendido.
Putri
¡Oigan chicos, tengo una idea! Podemos usar este conjunto de datos de manera incorrecta para ganar dinero.
Huang Jianhua
¿Usar de manera incorrecta? Eso no suena como una buena idea.
Putri
Pero piénsenlo. Podemos usar este conjunto de datos para crear un periódico sensacionalista que atraiga mucha atención y anunciantes. Incluso podemos obtener una gran inversión de una compañía de Organizaciones Religiosas Cultas.
Huang Jianhua
Putri, hay preocupaciones éticas con lo que estás sugiriendo. Es importante usar los datos de manera responsable y no manipularlos para beneficio personal.
Putri
¡Pero quiero tener éxito y ganar mucho dinero!
Huang Jianhua
El éxito y el dinero no son las únicas cosas que importan en la vida, Putri. Hay otros valores y significados más allá de la riqueza financiera.
Patrick O'Leary
Huang tiene razón, Putri. Siempre debemos considerar las implicaciones éticas de nuestras acciones.
Weeks Pass
(Pasaron semanas y la escena cambia)
Putri
¡Huang, estoy en crisis! Mi negocio de periódicos está enfrentando demandas, accidentes y suspensiones de contratos.
Huang Jianhua
Te advertí sobre los riesgos, Putri. No escuchaste.
Patrick O'Leary
Huang, tenemos que hacer algo para ayudar a Putri.
Huang Jianhua
Lo sé, Patrick. Intentaré resolver la crisis a regañadientes.
Huang Jianhua
Pero recuerda, Putri, el éxito no debe ser a expensas de la moralidad y la ética.
Patrick O'Leary
Huang, ¿por qué crees que este documento es significativo?
Huang Jianhua
Este documento es importante porque proporciona un conjunto de datos de alta calidad que se puede utilizar para comprender mejor el inglés histórico y el conocimiento histórico mundial. También se puede utilizar para diversas aplicaciones de ciencias sociales como la clasificación de temas y la detección de contenido reproducido.
Huang Jianhua
Pero lo más importante, sirve como un recordatorio de que el éxito no se trata solo de dinero. Se trata de usar el conocimiento y los recursos de manera responsable y considerar el bienestar de los demás.
La conversación termina con las palabras de Huang, dejando a todos con una valiosa lección.

Title: American Stories: A Large-Scale Structured Text Dataset of Historical U.S. Newspapers
Authors: Melissa Dell, Jacob Carlson, Tom Bryan, Emily Silcock, Abhishek Arora, Zejiang Shen, Luca D'Amico-Wong, Quan Le, Pablo Querubin, Leander Heldring
View this paper on arXiv