Hackathon SomosNLP 2024: #Somos600M

Vamos a crear un corpus que nos represente a los 600M de personas hispanohablantes y a estandarizar cómo evaluar nuestros LLMs.


Somos 600M de personas hispanohablantes, vamos a darle a nuestro idioma tan extendido y rico una representación justa en el ámbito del PLN. Participa en el Hackathon SomosNLP, una competición internacional online cuyo objetivo principal escrear recursos abiertos de PLN en español y lenguas cooficiales.

¿Lo mejor? ¡TODO EL MUNDO puede colaborar! 🎉

🚀 Nuestros objetivos

La democratización del PLN en español es nuestro objetivo principal en SomosNLP y creemos que una de las mejores maneras de avanzar hacia este objetivo es impulsando la creación de recursos abiertos de PLN en nuestro idioma.

En las ediciones pasadas contamos en total con más de 1000 participantes de 30 países distintos, superamos las 20.000 visualizaciones de nuestros eventos, aprendimos de 20 ponentes, desarrollamos 50 proyectos relacionados con los Objetivos de Desarrollo Sostenibles de la ONU, demostrando el potencial del PLN para abordar desafíos sociales. ¡Volvemos a por eso y mucho más! 💪

En esta tercera edición nos sumamos a la revolución de los LLMs y continuamos fijando objetivos de alto impacto:

  1. 🌎 Crear uncorpus de instrucciones de calidad que represente las variedades del español de los 600M de personas hispanohablantes.
  2. ✅ Crear unaleaderboard pública de LLMs en españolque permita estandarizar cómo evaluar y comparar los diferentes modelos en español y lenguas cooficiales.

¡Únete ya al mayor hackathon open-source de Procesamiento del Lenguaje Natural en español! 🚀

Cartel del Hackathon 2024

¿Cómo puedes colaborar?

💻 Participa en el hackathon

Al unirte a este hackathon tendrás la oportunidad de comprender cómo funcionan los grandes modelos del lenguaje (LLMs) y descubrir de manera aplicada los retos de cada etapa de su desarrollo: creación del corpus, entrenamiento y evaluación.

Desde SomosNLP queremos animarte a participar independientemente de tus conocimientos actuales. Organizaremos talleres prácticos y sesiones de mentoría para que puedan participar tanto grupos de institutos de investigación como grupos de estudiantes de grado, ¡todos los proyectos suman!

💡 Asiste a las charlas de especialistas

Durante los martes del mes de marzo tendrán lugar diversas keynotes impartidas por profesionales del mundo del Procesamiento del Lenguaje Natural. Estos eventos son gratuitos y están abiertos a todas las personas, independientemente de si participan en el hackathon.

¿Y hasta que llegue marzo?¡Están disponibles las grabaciones del 2023!

📚 Dona una base de datos

Como sabes, la clave de la IA reside en los datos. Como has visto, la iniciativa #Somos600M está centrada principalmente en la creación y recolección de bases de datos. Así quetanto si tienes un maravilloso corpus como si tienes un montón de documentos, ¡seguro que puedes colaborar!

🤗 Únete al equipo

Puedes colaborar creando contenido, recursos de apoyo (e.g., tutoriales), escribiendo artículos o investigando sobre IA en español.

🔊 Propón una ponencia

Invitamos a personas del ámbito académico o industrial, expertas y apasionadas del campo de la IA y en particular del PLN, a compartir sus conocimientos y avances. ¡Lee los temas sugeridos y mándanos tu propuesta!

🧑‍🏫 Ofrece una mentoría

Comparte tu experiencia y conocimiento apoyando a los equipos participantes a crear bases de datos de calidad y entrenar un buen LLM. Puedes impartir una mentoría puntual o continua. ¡Piensa en tus puntos fuertes y ofrece una mentoría!

🙌 Patrocina este maravilloso evento

SomosNLP es una comunidad sin ánimo de lucro, buscamos donaciones, premios y visibilidad para conseguir nuestros ambiciosos objetivos y crear impacto en el mundo hispanohablante. Toda la ayuda es bienvenida, descubre cómo puedes apoyar nuestra misión. ¡Contamos contigo!


🤗 Información

Para estar al día de todos los eventos y avances: