CICERO: Avance impresionante en Diplomacy [Descubre por qué]
Tabla de contenidos:
- Introducción
- Sinergia entre dinero e investigación
- Presentación de CICERO
- Contribuciones técnicas de CICERO
- Hipótesis sobre CICERO
- Reconocimiento de trabajos anteriores
- Limitaciones de CICERO en términos de comunicación
- Importancia de la fundamentación en CICERO
- Robustez de CICERO frente a estrategias humanas
- Cooperación y comunicación vs tácticas brutas en Diplomacy
- Importancia de la decepción en Diplomacy
- Reflexiones finales
💡 CICERO: La nueva era de la investigación en Diplomacy 💡
En la quinta Filípica, el orador romano Marcus Tullius Cicero dijo que los nervios de la guerra son el dinero infinito. En la era actual, con la proliferación de GPU y big data, parece que los nervios de la investigación también se han convertido en dinero infinito. Cuando un gigante de mil libras entra en la arena, el investigador académico se desespera y se pregunta si todo su trabajo ha sido en vano y cómo puede competir con el dinero infinito.
Recientemente, Meta anunció su nuevo modelo, CICERO, que se basa en su modelo anterior, SearchBot, capaz de jugar al Diplomacy sin presión. Si estás aquí, asumo que conoces las variantes de Diplomacy, cómo funciona el juego y la idea general de cómo CICERO juega.
Aunque el dinero infinito puede comprar una gran campaña de relaciones públicas, no debemos subestimar la importancia de CICERO desde una perspectiva técnica. Sus principales contribuciones se pueden dividir en: creación de una estrategia sólida, comunicación efectiva, reacción ante las comunicaciones y aprendizaje a partir de los datos de juego.
Mi hipótesis de trabajo sobre CICERO es que es un bot de juego de ataque directo que domina cualquier partida sin comunicación, pero que puede coordinarse con aliados cuando hay comunicación. Sin embargo, considero infundado afirmar que la IA ha dominado el Diplomacy, como se informa en science.org.
Debo admitir que, como alguien que ha trabajado en el análisis del lenguaje de Diplomacy desde 2015, estoy un poco resentido porque el artículo de CICERO no reconoce convenientemente el trabajo previo realizado. Esta falta de reconocimiento puede influir en mi opinión, por lo que sugiero que examines críticamente todo lo que digo aquí, al igual que deberías examinar críticamente las afirmaciones en el artículo de CICERO.
El artículo de CICERO tampoco contrasta adecuadamente con el trabajo relevante en el campo. Por ejemplo, nuestro equipo creó un detector de mentiras para el juego de Diplomacy, un paso muy similar al abordado por CICERO, pero nuestro trabajo no es citado en el contexto adecuado, a pesar de que llegamos al mismo porcentaje de acertar.
Además, quiero dejar claro que hablo en mi nombre, no en nombre de mi equipo, ni de mi institución, ni de mis financiadores. Las opiniones aquí expresadas son solo mías.
En el campo de la Diplomacy, las estrategias de cooperación, robustez, cooperación y decepción son fundamentales. CICERO ha abierto nuevas áreas de investigación y ha logrado un avance significativo en varios aspectos técnicos. Sin embargo, todavía hay margen de mejora y oportunidades para que otros investigadores trabajen en base a lo que CICERO ha logrado hasta ahora.
Uno de los aspectos clave en los que CICERO puede mejorar es la "fundamentación". Es común criticar a los modelos de lenguaje grandes por "inventarse cosas". Por lo tanto, es importante que CICERO esté bien fundamentado en la realidad y demuestre una comprensión efectiva de la situación del tablero y la capacidad de coordinación.
Sin embargo, existen desafíos en cuanto a la fundamentación, especialmente en juegos más largos que requieren una negociación coherente y una construcción de confianza. También es importante considerar la comunicación fuera del juego y los aspectos meta del juego, ya que forman parte de la experiencia del Diplomacy.
Otro aspecto crítico es la robustez de CICERO frente a las estrategias humanas. Aunque CICERO ha demostrado una gran capacidad para evaluar la posición en el tablero y utilizarla a su favor, no se ha demostrado claramente que sea mejor que los humanos en términos de comunicación.
La cooperación y la comunicación son elementos clave en el Diplomacy, y la interacción entre humanos y computadoras puede ser más efectiva que el juego individual. Creo que CICERO tiene un gran potencial en términos de coordinación y estrategias tácticas, pero considero que la falta de experimentos de ablación para analizar con mayor detalle cómo CICERO ha logrado sus victorias es una limitación del trabajo.
La decepción es otro aspecto importante en el Diplomacy. La habilidad para detectar mentiras y anticipar traiciones son habilidades necesarias para dominar este juego. No se ha demostrado de manera concluyente que CICERO sea particularmente bueno en detectar engaños, ni se ha explorado a fondo cómo el bot puede llevar a cabo estrategias de decepción de manera efectiva.
En resumen, aunque CICERO ha logrado avances impresionantes y ha abierto nuevas áreas de investigación en Diplomacy, aún hay aspectos en los que se puede mejorar. La cooperación, la comunicación efectiva, la fundamentación y la capacidad para lidiar con la decepción son elementos clave para dominar el juego. Espero que el trabajo de CICERO estimule a más personas a investigar el fascinante lenguaje de la Diplomacy y a prestar atención a lo que realmente hace que este juego sea divertido.
Esta es solo una de las conferencias de un curso que estoy impartiendo. Si quieres obtener el contexto completo, visita la página web del curso que se encuentra en el enlace de referencia. Allí podrás encontrar todos los videos en el orden Correcto, tareas, ejercicios y lecturas recomendadas.
Destacados:
- CICERO: un avance significativo en el juego de Diplomacy.
- La importancia de la cooperación y la comunicación en el juego.
- Limitaciones de CICERO en términos de fundamentación y robustez.