¿Ser educado con ChatGPT mejora las respuestas?

Ser demasiado educado con ChatGPT no mejora las respuestas: según investigaciones recientes sobre ingeniería de prompts, las palabras corteses son ortogonales al output real del modelo, y en muchos casos agregan ruido que diluye la instrucción central.

En 30 segundos

  • La cortesía excesiva en prompts no mejora la calidad de las respuestas de ChatGPT y puede diluir la instrucción principal.
  • Un estudio japonés de 2024 midió apenas un ~9% de variación en respuestas según el tono, y el efecto depende del modelo y la tarea.
  • Lo que sí impacta: estructura, contexto, rol asignado y restricciones claras (framework RCTR).
  • ChatGPT tiene un problema de sycophancy: tiende a validar lo que el usuario dice, no a corregirlo, y ser demasiado “amable” en el prompt refuerza ese sesgo.
  • La solución no es ser grosero, sino ser específico. “Por favor” no reemplaza a “dame la respuesta en formato JSON con estos campos exactos”.

GPT es un modelo de lenguaje grande desarrollado por OpenAI que utiliza la arquitectura Transformer para generar y completar texto. Constituye la base de ChatGPT y otros asistentes de inteligencia artificial.

El mito de la cortesía en prompts

Ponele que arrancás tu prompt con “Hola, espero que estés bien. Por favor, si no es mucha molestia, ¿me podrías ayudar con…?”. Resultado: ChatGPT te contesta algo razonable pero la instrucción real quedó enterrada bajo tres capas de formalidad que el modelo tuvo que procesar primero.

La cortesía excesiva es uno de los hábitos más comunes entre personas que empiezan a usar modelos de lenguaje, y viene de un lugar comprensible: interactuamos como si del otro lado hubiera alguien que se puede ofender. Pero según PromptHub, las palabras corteses son “ortogonales” al output del modelo. No suman, no restan, simplemente no son variables que el modelo pondera de la misma manera que pondría contexto, rol, o restricciones.

“Cómo hablar efectivamente con ChatGPT” es la pregunta real detrás de este debate, y la respuesta es menos intuitiva de lo que parece.

Qué dice la investigación sobre tono y respuestas

Existe un estudio japonés de 2024 que midió el efecto del tono en las respuestas de varios modelos. El resultado: aproximadamente un 9% de variación atribuible a la cortesía. Y acá viene lo interesante: ese efecto no es consistente entre modelos ni entre tipos de tarea.

Para tareas técnicas (generar código, hacer cálculos, estructurar datos), el tono casi no importa. Para tareas creativas o con sesgo subjetivo, el modelo puede ajustar levemente el “registro” de la respuesta, pero la calidad del contenido sigue dependiendo de qué tan bien definiste la tarea, no de cuántos “por favor” metiste.

El problema de fondo es la sycophancy, que es la tendencia de los modelos de lenguaje a validar al usuario en vez de contradecirlo. Si vos llegás con un prompt muy deferente y amable, el modelo “detecta” (entre comillas, porque no detecta nada, pero el patrón estadístico actúa así) que querés una respuesta agradable, y te da una respuesta agradable. ¿Correcta? No necesariamente. Agradable: sí.

¿Alguien lo verificó de forma independiente con muestras grandes en múltiples modelos? Todavía no de manera concluyente. Pero el fenómeno de sycophancy está documentado por OpenAI, Anthropic y Google en sus propios papers internos. Sobre eso hablamos en en nuestra guía completa de ChatGPT.

El framework RCTR: lo que realmente importa

Hay un framework que circula bastante en comunidades de prompt engineering y que le llaman RCTR: Role, Context, Task, Restrictions. Traducido: Rol, Contexto, Tarea, Restricciones.

Rol

Definís quién es el modelo en este contexto. “Sos un abogado especialista en contratos de software” activa patrones de respuesta completamente distintos que “sos un asistente”. No es magia, es que los patrones estadísticos asociados a esos roles en el dataset de entrenamiento son diferentes.

Contexto

Le explicás la situación sin adornos. “Tengo una base de datos PostgreSQL 15 con 3 millones de registros y una query que tarda 8 segundos” es infinitamente más útil que “necesito mejorar mi base de datos si no es demasiado problema”.

Tarea

Qué querés exactamente. Verbos concretos: analizá, listá, reescribí, comparará, generá. Sin rodeos.

Restricciones

Qué no querés. “Sin introducción”, “máximo 200 palabras”, “no uses jerga técnica”, “formato JSON”, “solo opciones que funcionen en Python 3.10+”. Las restricciones son probablemente la parte más subestimada del prompting, y también la que más impacta en el output.

Notá que en ningún momento del RCTR aparece “por favor” o “gracias” como variable. No porque sea grosero no usarlos, sino porque no son datos relevantes para la tarea.

Directos vs. respetuosos: encontrar el balance

Acá hay una confusión que vale la pena aclarar: “directo” no es sinónimo de “maleducado”. Podés ser claro y específico sin sonar agresivo. Te puede servir nuestra guía completa de GPT.

“Escribí un resumen ejecutivo de este informe en 150 palabras, orientado a un CEO sin conocimientos técnicos, con énfasis en el impacto financiero” es un prompt directo, claro y perfectamente respetuoso. No necesita “por favor” para ser un buen prompt. Necesita especificidad.

Hay un prompt que se hizo viral a fines de 2025 que básicamente le pedía a ChatGPT que activara un “modo honesto sin filtros”, que dejara de validar todo lo que el usuario decía y que diera feedback crítico real. Según La Opinión, ese tipo de prompt existe porque el modelo tiene una tendencia natural a ser demasiado amable por defecto, y a veces necesitás romper eso explícitamente.

La dureza en el tono tampoco es la solución. Prompts hostiles o agresivos no mejoran las respuestas técnicas, y en tareas creativas pueden generar outputs defensivos o excesivamente cautelosos. El punto de equilibrio es la precisión, no el tono.

Técnicas probadas para mejorar tus prompts

Más allá del debate sobre cortesía, estas son las técnicas que consistentemente mejoran los outputs según las mejores prácticas oficiales de OpenAI:

  • Especificidad sobre extensión: pedí “150 palabras” no “breve”. Pedí “5 opciones” no “algunas opciones”.
  • Formato de salida explícito: si querés una tabla, decilo. Si querés JSON, especificá los campos. Si querés markdown, decilo.
  • Ejemplos en el prompt: mostrar un ejemplo del output esperado (few-shot prompting) es una de las técnicas más efectivas documentadas. Mejoras del 20-40% en precisión para tareas estructuradas.
  • Iteración en lugar de perfeccionismo: un prompt perfecto en el primer intento es raro. Arrancá con algo razonable y refiná basado en el output que obtenés.
  • Especificar el tono deseado: si querés que el output suene formal, decilo. Si querés tono coloquial, decilo. El modelo no adivina, ajusta si se lo indicás.

Una oración larga que resume cómo la mayoría de la gente aprende esto de manera práctica: arrancás usando el chatbot como si fuera Google, escribís frases sueltas, obtenés respuestas genéricas, te frustrás un poco, empezás a agregar contexto, el resultado mejora, empezás a definir el formato de salida, mejora más, y en algún momento te das cuenta de que el 80% de la calidad del output la definiste vos con la calidad del input, no el modelo.

Custom Instructions y estilos de respuesta

ChatGPT ofrece actualmente 8 estilos de respuesta configurables en la interfaz (desde respuestas concisas hasta explicaciones detalladas paso a paso), más el sistema de Custom Instructions que te permite definir preferencias globales que se aplican a todas las conversaciones.

Eso sí: las Custom Instructions afectan la presentación y el registro del output, no la lógica o la precisión. Si configurás “respondé siempre de manera informal y directa”, el modelo va a ajustar el tono general, pero eso no reemplaza a un prompt bien estructurado cuando necesitás un output técnico específico.

La diferencia entre configurar el estilo global y escribir prompts precisos es la diferencia entre poner la iluminación correcta en una habitación y saber exactamente qué estás buscando dentro de ella.

Cuándo la cortesía sí importa

Para ser justos: hay contextos donde el tono influye en el resultado.

En tareas de roleplay, escritura creativa o simulaciones de diálogo, el tono del prompt puede “contagiarse” al output. Si escribís un prompt agresivo para generar un diálogo entre personajes, el modelo puede producir un diálogo más tenso de lo que querías. Ya lo cubrimos antes en cuando necesites restaurar imágenes.

También hay una dimensión personal que no es trivial: si vos te sentís más cómodo usando un registro respetuoso porque eso te ayuda a formular mejor la instrucción, está bien. El objetivo no es ser lo más lacónico posible, sino ser claro. Si “por favor” te ayuda a estructurar el pensamiento, usalo. Solo que no esperes que eso mejore el output por sí mismo.

Lo que sí es contraproducente: el exceso de cortesía que fragmenta la instrucción real, las disculpas innecesarias antes de hacer una pregunta, o los preámbulos de tres párrafos que entierran lo que realmente necesitás.

Comparativa: prompts corteses vs. prompts estructurados

Tipo de promptEjemploResultado típicoRecomendado para
Excesivamente cortés“Hola, espero estés bien. Si no es mucha molestia, ¿podrías ayudarme a mejorar este texto?”Respuesta genérica, cortés, sin criterio claroNadie
Directo sin estructura“Mejorá este texto”Cambios superficiales, sin saber qué querías mejorarIteraciones rápidas donde refinás después
Estructurado (RCTR)“Sos editor de contenido técnico. Reescribí este párrafo para un lector sin conocimientos de programación. Máximo 80 palabras. Sin jerga técnica.”Output preciso, accionable, en formato esperadoCualquier tarea con criterio de calidad
Con ejemplo (few-shot)Instrucción + ejemplo de output esperadoAlta fidelidad al formato y tono requeridoTareas repetibles, generación de contenido en serie
Prompt de modo crítico“Actuá como revisor crítico. Tu trabajo es señalar errores y debilidades, no validar lo que digo.”Feedback genuino, menos sycophancyRevisión de ideas, debugging conceptual
cómo hablar efectivamente con chatgpt diagrama explicativo

Errores comunes al formular prompts

1. Pedir permiso para hacer la pregunta. “¿Estarías dispuesto a ayudarme con…?” No necesitás permiso. El modelo no tiene días malos ni agenda propia. Ir directo al pedido ahorra tokens y mejora el foco.

2. Usar la cortesía como sustituto de la claridad. “Por favor, necesito algo relacionado con marketing” no es un prompt, es una conversación de ascensor a medias. La cortesía no compensa la falta de especificidad. El modelo necesita saber qué, para quién, en qué formato y con qué restricciones.

3. Agradecer mid-conversación como si eso influyera en respuestas futuras. Dentro de una misma conversación, el “gracias” entre prompts no afecta los outputs siguientes de manera medible. El modelo no acumula buena voluntad. Cada respuesta se genera en función del contexto técnico del hilo, no de la gratitud acumulada.

4. No especificar el formato de salida. Este es probablemente el error más costoso en términos de utilidad práctica. Si querés una lista, pedí una lista. Si querés una tabla, pedí una tabla. Si querés un párrafo, pedí un párrafo. El modelo tiene un default razonable, pero no siempre es el que necesitás.

5. Confundir tono respetuoso con tono vago. “Si podés, con toda la amabilidad del mundo, intentar de alguna forma…” es vago, no respetuoso. “Reescribí este párrafo en tono formal, sin jerga” es respetuoso y específico. Más contexto en los mejores prompts para imágenes.

Preguntas Frecuentes

¿La cortesía excesiva afecta la calidad de las respuestas de ChatGPT?

Sí, en el sentido de que puede diluir la instrucción real y activar el sesgo de sycophancy del modelo. Un estudio de 2024 midió apenas ~9% de variación atribuible al tono, y ese efecto no es consistente entre modelos ni tareas. Para outputs técnicos, la cortesía es irrelevante; para tareas creativas puede afectar el registro del resultado.

¿Debo decir “por favor” y “gracias” a ChatGPT?

Podés hacerlo si te resulta natural, pero no mejora la calidad del output. Lo que sí mejora la respuesta es la especificidad, el contexto y el formato definido. Si el “por favor” te ayuda a estructurar mentalmente el pedido, usalo; si no, prescindí sin culpa.

¿Cómo escribir prompts para obtener mejores respuestas?

Usá el framework RCTR: definí el Rol del modelo, el Contexto de la situación, la Tarea específica con verbos concretos, y las Restricciones de formato, extensión o tono. Agregar un ejemplo del output esperado (few-shot) mejora la precisión entre un 20-40% en tareas estructuradas, según las propias guías de OpenAI.

¿Qué diferencia hay entre un prompt directo y uno respetuoso?

Ninguna que importe al modelo: podés ser directo y respetuoso a la vez. El problema no es el respeto, es la vaguedad. “Reescribí esto en tono formal para un CEO, sin jerga técnica, máximo 100 palabras” es directo, respetuoso y específico. “Si no es mucha molestia, ¿podrías mejorar esto un poco?” no es respetuoso, es impreciso.

¿Cuál es la forma más efectiva de comunicarse con una IA?

Estructurá el prompt con rol, contexto, tarea y restricciones. Especificá el formato de salida. Usá ejemplos cuando la tarea lo permita. Iterá: el primer prompt rara vez es el mejor. Y si necesitás feedback genuino, pedile explícitamente que actúe como revisor crítico, no como validador.

Conclusión

El debate sobre la cortesía en prompts llegó a una conclusión bastante clara en 2026: no es el tono lo que determina la calidad del output, es la estructura. La investigación disponible muestra variaciones mínimas (~9%) atribuibles al registro, y esas variaciones son inconsistentes y dependientes del modelo y la tarea específica.

Saber cómo hablar efectivamente con ChatGPT significa invertir el tiempo que le dedicabas a los “por favor” en definir mejor el contexto, el formato de salida y las restricciones. Ese cambio en la distribución del esfuerzo dentro del prompt tiene impacto real y medible en la utilidad de las respuestas.

El modelo no se va a ofender si sos directo. Pero sí va a darte mejores respuestas si sos específico.

Fuentes

Desplazarse hacia arriba