Con el de Huaxtla, ya son tres ejidos que le quitan tierras al área natural protegida de La Primavera....
La joven fue vista por última vez el 13 de mayo....
En su paso como director del Comude Guadalajara, Albino Galván fue un viajero frecuente que no escatimó en hospedaje y comida....
Desde el fin de semana se realiza el conteo y sellado de las boletas electorales de manera ininterrumpida....
De los 53 mil 981 aspirantes sólo acudió 96.07 por ciento es decir 51 mil 861 de los aspirantes aplicaron su Prueba de Aptitud Académica...
México Evalúa presentó a los candidatos análisis y propuestas de soluciones para el sector educativo...
La votación, que se prolongará hasta el 17 de mayo, es la segunda que UAW organiza en las últimas semanas en una planta de montaje de automóviles ...
Los incidentes eléctricos ocurren mientras México afronta una segunda onda de calor, que se extenderá hasta el sábado, con temperaturas superiores...
Boeing y la NASA aplazan otra vez el envío de la primera misión tripulada de Starliner...
La empresa había advertido que emprendería acciones legales en abril, después de que el Congreso de Estados Unidos aprobó dicha ley que obliga a B...
Pese a que ya empezó la temporada de lluvias 2024, la Comisión Nacional del Agua (Conagua) reconoció que las presas de México presentan bajos nive...
Xóchitl Gálvez caminó entre la marea de personas con playeras rosas, banderas del PAN y del PRD este domingo 19 de mayo, antes del tercer debate pr...
La policía entró al campus a eso de las nueve de la noche, hora local, poco después de que un grupo de personas, de Penn Gaza Solidaity, entraran a...
Poco después del inicio de la guerra, Francisco nombró al cardenal italiano Matteo Zuppi para que se ocupase de una misión de mediación sobre todo...
La primera mitad fue de emociones, con los dos cuadros con actitud ofensiva....
Pacers se medirá a Boston por el Este....
La presentación de este filme fue controversial y se hizo fuera de competición....
Será el Teatro Diana el que recibirá a la agrupación estadounidense....
El cantante visitó Guadalajara para promocionar su nuevo material discográfico....
Osborne elogió este viernes "la labor detectivesca" de los empleados para trazar los ejemplares perdidos, así como la ayuda de numerosos simpatizant...
Megalópolis recibe moderados aplausos y abucheos durante el festival francés....
Tejiendo la marea rosa
Tomando el Zócalo
OpenAI creó un programa para transcribir más de un millón de horas de videos de YouTube con el objetivo de entrenar el modelo de generación de texto GPT-4, su modelo más avanzado abierto al público, según una exclusiva de The New York Times (NYT) publicada este sábado.
El diario asegura que OpenAI, una empresa sin ánimo de lucro, desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en videos para obtener datos de entrenamiento de modelos de generación de lenguaje, conocidos como LLM.
Las fuentes consultadas por el NYT aseguran que el equipo encargado de Whisper incluía a Greg Brockman, presidente de OpenAI.
La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de términos de uso.
Según el artículo, OpenAI consideró que necesitaba más datos de entrenamiento en 2021 y discutió si obteneros de Youtube, podcast o audiolibros.
En una reciente entrevista el consejero ejecutivo de YouTube, Neal Mohan, aseguró que si OpenAI ha usado vídeos de la plataforma para entrenar 'Sora', su modelo de generación de vídeos realistas, estaría violando sus términos de servicio.
"Los creadores de contenido que vienen a Youtube tienen ciertas expectativas, entre ellas que los términos de servicio se cumplen. Nuestros términos permiten extraer cierto contenido como el título, el nombre de canal o el nombre del creador para facilitar la web abierta", explicó Mohan.
"No está permitido descargar las transcripciones o partes de los videos. Eso es una violación clara de nuestros términos de contenido", añadió el directivo.
La portavoz de OpenAI Lindsay Held indicó en una respuesta a la exclusiva obtenida por The Verge que la compañía crea bases de datos "únicas" y utiliza "numerosas fuentes disponibles públicamente y realiza acuerdos para obtener dato que no es público".
Google transcribe los videos de Youtube para obtener texto para alimentar a sus modelos de generación de texto, algo que violaría los derechos de los creadores que suben sus videos a la plataforma, según fuentes consultadas por el diario.
Los derechos sobre el contenido usado para entrenar modelos de Inteligencia Artificial aún no están bien definidos y la competitividad para conseguir los mejores modelos de generación de contenido realista está llevando a empujar las fronteras de la legalidad en derechos de autor.
El gigante tecnológico Meta, creador de Facebook, debatió el año pasado si comprar la editorial Simon & Schuster para obtener acceso a su material de largo formato, según el contenido de reuniones entre gerentes, abogados e ingenieros de la compañía a los que tuvo acceso el NYT.
EH