Prompts para Suno AI: guía paso a paso

En pocas palabras: Suno AI canta el prompt porque interpreta todo texto libre como letra. La solución: activá el Modo Personalizado y separá las instrucciones de la letra usando las etiquetas [verse], [chorus] y [bridge]. Poné género y mood en sus campos; reservá el campo de letra solo para el contenido lírico.

Cuando creás una canción en Suno AI y el modelo convierte tus instrucciones directamente en letra, el problema no es un bug: es que Suno interpreta todo texto libre como contenido lírico. La solución pasa por usar el Modo Personalizado y estructurar el prompt con etiquetas específicas que separen las instrucciones técnicas de las letras reales.

En 30 segundos

Suno AI trata todo texto libre como letra potencial: si no separás instrucciones de contenido lírico, las canta.
El Modo Personalizado (Custom Mode) tiene campos separados para género, mood y letra — usalos siempre.
Las etiquetas [verse], [chorus], [bridge] le indican a Suno qué es estructura y qué es letra.
El orden importa: primero género y era musical, después mood e instrumentos, al final la letra.
Cambiá solo 1-2 variables por iteración para saber qué ajuste funcionó.

¿Por qué Suno AI interpreta mal los prompts?

Suno AI es una herramienta de generación musical con IA que crea canciones completas a partir de descripciones de texto. El problema con el prompt libre es estructural: el modelo no tiene forma de saber si lo que le mandás son instrucciones técnicas (“quiero un beat de trap con 140 BPM”) o letra real (“quiero un beat de trap con 140 BPM, que la vida me pesa”). Para Suno, todo es potencialmente singable.

Ponele que escribís algo como “upbeat pop song about summer with acoustic guitar and bright vocals, happy and carefree”. Suena a instrucción. Pero Suno puede tomar “happy and carefree” y meterlo en el estribillo. O directamente intentar cantar “acoustic guitar and bright vocals” como si fuera poesía. Pasa más seguido de lo que parece.

El modelo prioriza el texto como contenido lírico porque eso es lo que mayormente recibe. Según la documentación oficial de Suno, el campo de texto libre está diseñado para describir el estilo general, pero sin formato estructurado, la IA hace su mejor interpretación de qué es qué. Y esa interpretación no siempre coincide con lo que vos querías.

Usar el Modo Personalizado en suno ai

El Modo Personalizado (Custom Mode) es la solución más directa. En vez de un único campo de texto libre, te da campos separados para cada elemento de la canción.

Cómo acceder al Custom Mode

En la interfaz de Suno, buscá el toggle “Custom” antes de generar. Al activarlo aparecen campos diferenciados: uno para el estilo musical y otro específico para la letra. Esa separación es todo. Relacionado: comportamientos inesperados de ChatGPT.

Qué completar en cada campo

Style of Music: género, era, referencias de artistas, instrumentación, tempo, mood. Solo descriptores técnicos y estéticos. Sin frases que suenen a letra.
Lyrics: únicamente la letra real de la canción, estructurada con etiquetas de sección.
Title: el nombre de la canción. Tampoco lo dejes vacío, influye en el resultado.

Con los campos separados, Suno entiende qué es instrucción y qué tiene que cantar. Simple como eso. (Que no lo hagan más obvio en la interfaz es un misterio.)

Separar instrucciones de letras con formato y etiquetas

Si usás el campo de letra, estructurala con etiquetas. Suno reconoce un conjunto de tags que le indican cómo organizar el contenido lírico y dónde va cada sección.

Las etiquetas básicas que funcionan:

[verse] — estrofa
[chorus] — estribillo
[bridge] — puente
[outro] — cierre
[pre-chorus] — pre-estribillo
[intro] — introducción instrumental

Un ejemplo concreto de cómo se vería la letra bien estructurada:

[verse] Caminé por las calles vacías buscando algo que ya no está [chorus] No hay vuelta atrás solo el viento y yo [bridge] Pero el tiempo sigue y yo también

Líneas en blanco entre secciones. Etiquetas en corchetes, sin texto adicional en la misma línea. Así Suno entiende la arquitectura de la canción sin confundirla con contenido lírico.

Estructura de prompt efectiva: el orden importa

En el campo de estilo, el orden en que ponés la información afecta el resultado. Según la guía de estructura de prompts de Suno AI Wiki, el modelo le da más peso a lo que aparece primero.

El orden recomendado:

Primero: género principal + era o década (“indie rock de los 90”, “jazz de los 50”, “electronic 2020s”)
Segundo: referencias de artistas o bandas (“al estilo de Radiohead”, “influencias de Carlos Gardel”)
Tercero: mood y energía (“melancólico”, “eufórico”, “introspectivo”)
Cuarto: instrumentación específica (“guitarra acústica fingerpicking, bajo suave, sin batería”)
Al final: detalles de producción (“reverb amplio”, “producción lo-fi”, “mezcla limpia”)

Lo que no funciona es mezclar descriptores con frases que suenan a letra en el mismo campo. “Una canción triste sobre el fin del verano con guitarra” puede funcionar. “Una canción donde el protagonista recuerda el mar con nostalgia y guitarra suave” tiene muchas chances de terminar como letra cantada. Te puede servir nuestra cobertura de cómo funcionan los modelos de lenguaje.

El caso especial del español: lo que funciona y lo que no

El español tiene una ventaja técnica real en Suno: las reglas fonéticas son consistentes. Una vez que el modelo aprende a pronunciar una vocal, la aplica consistentemente en toda la canción. Eso lo hace más predecible que el inglés para ciertos géneros.

Eso sí, los géneros latinos necesitan tags específicos para funcionar bien. Según la guía de prompts en español de HookGenius, si querés reggaeton, bachata o corridos, nombralos explícitamente en el campo de estilo. No alcanza con “música latina” porque el modelo puede derivar a algo genérico que no se parece a ningún género en particular.

Un problema conocido con el español: la palabra “puente” a veces la pronuncia como “puenta” (influencia del inglés o datos de entrenamiento con variantes). Si querés evitarlo, usá directamente la etiqueta [bridge] en inglés para la estructura, y escribí la letra del puente en español. El tag es instrucción, la letra es contenido.

Errores específicos que llevan a resultados raros

Mezclar géneros incompatibles

“Folk metal con trap y bossa nova” es demasiado para que cualquier modelo resuelva de forma coherente. Si querés fusión, elegí dos géneros máximo, y uno que sea dominante. El modelo necesita un ancla estética.

Descriptores emocionales que suenan a letra

“Una canción que haga sentir que estás caminando bajo la lluvia en una ciudad que ya no es tuya” es una imagen hermosa. Y tiene todas las chances de terminar cantada tal cual. Si querés ese mood, traducilo a parámetros técnicos: “ambient, piano solo, reverb largo, tempo lento 60bpm, melancólico”.

Sobrecargar el prompt con demasiados elementos

Más de 8-10 descriptores en el campo de estilo empieza a degradar la coherencia del resultado. El modelo no puede priorizar todo al mismo tiempo (si es que eso cuenta como priorización). Quedate con lo esencial. En alternativas como Claude profundizamos sobre esto.

No usar título

Dejarlo vacío le saca información de contexto al modelo. Un título concreto (“Lluvia de agosto”, “Sin retorno”) ayuda a Suno a establecer el tono general, especialmente cuando el estilo es ambiguo.

Iteración: cambiar poco para entender qué funciona

El error más común al usar Suno es cambiar cinco cosas al mismo tiempo entre una generación y la siguiente. Si el resultado mejoró, no sabés qué funcionó. Si empeoró, tampoco.

La estrategia que funciona: cambiá 1-2 variables por iteración. Probaste con “guitar pop melancólico” y no te convenció el mood. En la siguiente, cambiá solo el mood a “introspectivo” y dejá todo lo demás igual. Así tenés un punto de comparación real.

¿Cómo sabés si una instrucción la está ignorando Suno? Si repetís el mismo descriptor tres generaciones seguidas y el resultado no cambia en esa dimensión, el modelo probablemente no lo está procesando. Probá reescribirlo con otras palabras o ubícalo primero en el campo de estilo.

Si querés convertir tu canción Suno en video, tenemos un artículo sobre When I create a song it makes the prompt into lyrics. How to.

Si querés entender por qué el prompt se convierte en letra al crear una canción, esto se conecta con When I create a song it makes the prompt into lyrics. How to.

Si querés entender cómo funciona eso, acá tenés un artículo que lo explica: When I create a song it makes the prompt into lyrics. How to.

Problema	Causa probable	Solución
El prompt aparece cantado	Texto libre sin estructura en campo de letra	Usar Custom Mode + etiquetas [verse] [chorus]
El género suena genérico	Descriptor vago (“música latina”)	Nombrar el género específico: reggaeton, bachata, cumbia
La pronunciación es rara en español	Interferencia del inglés en modelo	Usar tags en inglés, letra en español
Resultado incoherente	Demasiados géneros mezclados	Máximo 2 géneros, uno dominante
Los cambios no tienen efecto	Descriptor al final del campo	Mover el descriptor clave al inicio

suno ai prompt letras diagrama explicativo

Preguntas Frecuentes

¿Por qué Suno AI convierte mi prompt en letras de la canción?

Suno trata el texto libre como contenido lírico potencial porque no tiene forma de distinguir automáticamente entre instrucción técnica y letra. Cuando usás el campo de texto sin formato estructurado, el modelo interpreta todo como candidato a ser cantado. La solución es usar Custom Mode con campos separados y etiquetas de sección. Tema relacionado: limitaciones conocidas en GPT.

¿Cómo le digo a Suno qué elementos quiero sin que aparezcan en la letra?

Usá el campo “Style of Music” exclusivamente para descriptores técnicos: género, era, mood, instrumentación. Nunca mezcles frases narrativas o emocionales en ese campo. La letra va en el campo “Lyrics”, estructurada con etiquetas como [verse] y [chorus].

¿Qué es el Modo Personalizado de Suno y cómo lo uso?

Custom Mode es la vista avanzada de Suno que separa el estilo musical de la letra en campos distintos. Se activa con un toggle en la interfaz antes de generar. Te da control sobre el título, el estilo y la letra por separado, lo que elimina la ambigüedad del campo de texto libre y reduce significativamente los errores de interpretación.

¿Cómo separo instrucciones musicales de letras en Suno AI?

Usá Custom Mode para separarlas en campos distintos. Dentro del campo de letra, estructurá el contenido con etiquetas: [verse] para estrofas, [chorus] para estribillo, [bridge] para el puente. Dejá líneas en blanco entre secciones. Las etiquetas son instrucciones de estructura que Suno no canta.

¿Funciona bien el español en Suno AI?

Sí, con algunas consideraciones. La fonética del español es consistente y el modelo la maneja bien en la mayoría de los géneros. Para géneros latinos específicos (reggaeton, bachata, corridos), nombrá el género explícitamente en el campo de estilo. Algunos términos pueden tener pronunciación incorrecta: si usás palabras de estructura como “puente”, reemplazalas por el tag en inglés [bridge].

Conclusión

El problema de Suno convirtiendo el prompt en letra no tiene nada de misterioso una vez que entendés cómo procesa el texto. El modelo no lee intenciones, lee caracteres. Si no separás instrucción de contenido lírico con formato explícito, va a hacer su mejor guess, y ese guess suele ser cantarte las instrucciones.

La combinación que elimina el problema en la mayoría de los casos: Custom Mode activado, campo de estilo con descriptores técnicos ordenados de género a detalle, y campo de letra con etiquetas de sección. Si a eso le sumás iterar de a una variable por vez, el proceso se vuelve bastante predecible.

Suno v5 viene respondiendo bien a prompts más estructurados, con mayor adherencia a las instrucciones de estilo. Pero la arquitectura de separación de campos es independiente de la versión: va a seguir siendo la práctica recomendada mientras el modelo procese texto libre como candidato lírico.

Si te está costando con las letras, podés revisar solucionar problemas de letras en nuestra guía.

Esto se conecta con prompts en Suno, donde cubrimos el tema en detalle.

Fuentes

Ejemplo práctico

Lucía Ferreyra, community manager de una panadería en Rosario, necesitaba un jingle de 40 segundos para un reel de Instagram. En su primer intento escribió todo junto en el campo de letra: «cumbia alegre sobre medialunas recién horneadas, voz femenina». Suno se lo cantó tal cual: el estribillo decía «cumbia alegre sobre medialunas». Frustrada después de 8 generaciones fallidas, pasó al Modo Personalizado y separó los campos. En Style of Music puso «cumbia argentina, BPM 100, voz femenina cálida, acordeón»; dejó el toggle de «Instrumental» apagado; y en el campo de letra cargó solo el contenido lírico con etiquetas:

[Verse]
Salen calentitas, recién del horno
el aroma invita a todo el barrio

[Chorus]
Medialunas de la abuela
dulzura que te desvela

En la iteración siguiente cambió una sola variable (subió el BPM de 100 a 110) para encontrar el punto justo de energía, sin tocar la letra ni el género.

Resultado: de 8 intentos fallidos pasó a un jingle aprobado en la 2.ª generación del Modo Personalizado. Tiempo total: 12 minutos contra los 45 que había perdido antes, y el estribillo quedó cantando exactamente las dos líneas que ella escribió, sin instrucciones técnicas coladas en la letra.