😧 La retroalimentación humana hace que la IA sea mejor para engañarnos
Una de las técnicas más populares que utilizan las empresas de IA para mejorar la calidad de sus grandes modelos lingüísticos, la retroalimentación humana, puede hacer que esos modelos sean mejores para engañarnos, según un nuevo estudio preliminar de Anthropic e investigadores de universidades chinas y estadounidenses.