Why Johnny can’t prompt: how non-AI experts try (and fail) to design LLM prompts
| dc.creator | Zamfirescu-Pereira, J.D. | |
| dc.creator | Y. Wong, Richmond | |
| dc.creator | Hartmann, Richmond | |
| dc.creator | Yang, Qian | |
| dc.date.accessioned | 2025-12-10T20:11:57Z | |
| dc.date.created | 2023 | |
| dc.description.abstract | Pre-trained large language models (“LLMs”) like GPT-3 can engage in fluent, multi-turn instruction-taking out-of-the-box, making them attractive materials for designing natural language interactions. Using natural language to steer LLM outputs (“prompting”) has emerged as an important design technique potentially accessible to non-AI-experts. Crafting effective prompts can be challenging, however, and prompt-based interactions are brittle. Here, we explore whether non-AI-experts can successfully engage in “end-user prompt engineering” using a design probe—a prototype LLM-based chatbot design tool supporting development and systematic evaluation of prompting strategies. Ultimately, our probe participants explored prompt designs opportunistically, not systematically, and struggled in ways echoing end-user programming systems and interactive machine learning systems. Expectations stemming from human-to-human instructional experiences, and a tendency to overgeneralize, were barriers to effective prompt design. These findings have implications for non-AI-expert-facing LLM-based tool design and for improving LLM-and-prompt literacy among programmers and the public, and present opportunities for further research. | |
| dc.description.abstractenglish | Los modelos de lenguaje grande (LLM) preentrenados, como GPT-3, pueden realizar instrucciones fluidas y de múltiples turnos de forma inmediata, lo que los convierte en materiales atractivos para diseñar interacciones de lenguaje natural. El uso del lenguaje natural para dirigir los resultados de los LLM («incitación») se ha convertido en una importante técnica de diseño, potencialmente accesible para quienes no son expertos en IA. Sin embargo, crear indicaciones efectivas puede ser un desafío, y las interacciones basadas en indicaciones son frágiles. Aquí, exploramos si quienes no son expertos en IA pueden participar con éxito en la «ingeniería de indicaciones para el usuario final» utilizando una sonda de diseño: una herramienta prototipo de diseño de chatbot basada en LLM que respalda el desarrollo y la evaluación sistemática de estrategias de indicación. En última instancia, los participantes de nuestra sonda exploraron los diseños de indicaciones de forma oportunista, no sistemática, y tuvieron dificultades de maneras que evocaban los sistemas de programación para el usuario final y los sistemas interactivos de aprendizaje automático. Las expectativas derivadas de las experiencias instruccionales entre humanos y la tendencia a la generalización excesiva fueron barreras para el diseño efectivo de indicaciones. Estos hallazgos tienen implicaciones para el diseño de herramientas basadas en LLM dirigidas a no expertos en IA y para mejorar la alfabetización en LLM y en indicaciones entre los programadores y el público, y presentan oportunidades para futuras investigaciones. | |
| dc.format.extent | 1 página | |
| dc.format.mimetype | text/html | |
| dc.identifier.other | https://dl.acm.org/doi/full/10.1145/3544548.3581388 | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12010/38628 | |
| dc.language.iso | en_US | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.local | Abierto (Texto Completo) | |
| dc.subject | Modelos de lenguaje | |
| dc.subject | Lenguaje natural | |
| dc.subject | Expertos en IA | |
| dc.subject.keyword | Language models (Artificial intelligence) | |
| dc.subject.keyword | Human-computer interaction | |
| dc.subject.keyword | Artificial intelligence - Social aspects | |
| dc.subject.lemb | Modelos de lenguaje (Inteligencia artificial) | |
| dc.subject.lemb | Interacción humano-computador | |
| dc.subject.lemb | Inteligencia artificial - Aspectos sociales | |
| dc.title | Why Johnny can’t prompt: how non-AI experts try (and fail) to design LLM prompts | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7ad9 |
Archivos
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 3.28 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
