Navegación del sitio
Enlaces rápidos de navegación
Navegación móvil
Navegación del sitio
Investigación
API
ChatGPT
Empresa
Enlaces rápidos
Asociaciones de datos de OpenAI
Trabajando juntos para crear conjuntos de datos de código
Enlaces rápidos
Autores
Estamos presentando las Asociaciones de Datos de OpenAI, donde trabajaremos en colaboración con organizaciones para producir conjuntos de datos públicos y privados para entrenar modelos de inteligencia artificial
La tecnología de IA moderna aprende habilidades y aspectos de nuestro mundo, como las personas, nuestras motivaciones, interacciones y la forma en que nos comunicamos, al comprender los datos en los que se entrena. Para lograr finalmente una AGI que sea segura y beneficiosa para toda la humanidad, nos gustaría que los modelos de IA comprendan profundamente todos los temas, industrias, culturas e idiomas, lo cual requiere un conjunto de datos de entrenamiento lo más amplio posible.
Incluir tu contenido puede hacer que los modelos de IA sean más útiles para ti al aumentar su comprensión de tu dominio. Ya estamos trabajando con muchos socios que están ansiosos por representar datos de su país o industria. Por ejemplo, recientemente nos asociamos con el Gobierno de Islandia y Miðeind ehf para mejorar la capacidad de GPT-4 para hablar islandés mediante la integración de sus conjuntos de datos seleccionados. También nos asociamos con la organización sin fines de lucro Free Law Project, que tiene como objetivo democratizar el acceso a la comprensión legal al incluir su gran colección de documentos legales en el entrenamiento de IA. Sabemos que puede haber muchos más que también desean contribuir al futuro de la investigación en IA mientras descubren el potencial de sus datos únicos.
Las asociaciones de datos tienen como objetivo permitir que más organizaciones contribuyan a guiar el futuro de la inteligencia artificial y se beneficien de modelos que sean más útiles para ellos, al incluir contenido que les interese.
Estamos buscando tipos de datos específicos que reflejen la sociedad humana a gran escala y que actualmente no sean accesibles en línea para el público en general. Podemos trabajar con cualquier tipo de información, ya sea texto, imágenes, audio o video. Nos interesa especialmente obtener datos que expresen la intención humana, como escritos extensos o conversaciones completas en lugar de fragmentos desconectados, en cualquier idioma, tema o formato.
Podemos trabajar con datos en casi cualquier formato y utilizar nuestra tecnología de inteligencia artificial de última generación para ayudarte a digitalizar y estructurar tus datos. Por ejemplo, contamos con una tecnología de reconocimiento óptico de caracteres (OCR) de primer nivel para digitalizar archivos como PDF, y un reconocimiento automático de voz (ASR) para transcribir palabras habladas. Si los datos necesitan ser limpiados (por ejemplo, si tienen muchos artefactos generados automáticamente o errores de transcripción), podemos trabajar con tu equipo para procesarlos de la forma más útil. No estamos buscando conjuntos de datos con información sensible o personal, ni información que pertenezca a terceros; podemos trabajar contigo para eliminar esta información si necesitas ayuda.
Formas de asociarse con nosotros
Actualmente tenemos dos formas de asociarnos y es posible que se expandan en el futuro.
En resumen, estamos buscando colaboradores que quieran ayudarnos a enseñar a la inteligencia artificial a comprender nuestro mundo para que pueda ser de máxima utilidad para todos. Juntos, podemos avanzar hacia una IA general que beneficie a toda la humanidad.
Escritores
OpenAI
Investigación
API
ChatGPT
Compañía
Social