Si puedes escribir o hablar, probablemente puedas código de ambiente. Realmente es así de simple. Simplemente comunica tus ideas. chatbot de IA con el lenguaje natural de su elección y funcionará. Si bien no todos los proyectos pueden ser una joya o incluso completamente funcionales, el esfuerzo requerido para crear una aplicación web con solo chat es mínimo.
He jugado bastante con la codificación vibe, creando proyectos aleatorios aquí y allá. Lo he probado principalmente como prueba de concepto o simplemente con fines de prueba de chatbot, pero rara vez en un intento de hacer algo importante o funcional en el que me vería usándolo todos los días. Luego comencé a buscar un dispositivo de lectura electrónica y terminé decepcionado por lo increíblemente “tontos” que son la mayoría de ellos, especialmente los Kindles. Más sobre eso más adelante.
Cualquiera que sea la motivación (pero sobre todo el desafío de Amazon), me impulsó a probar una vibra de código fijo, pero con un giro. Quería ver si podía codificar una aplicación de lectura electrónica funcional con todas las funciones que quería. Sabiendo que incluso si hago esto, probablemente no lo usaré todos los días, pero quería agregarle algo de estilo.
La pregunta es qué chatbot de IA utilizar. No me molesté en intentar elegir. He usado gemini, clod y chatgpt para crear lo que quiero y luego ver si alguno da mejores resultados.
inmediato
Comparar chatbots es difícil, especialmente cuando se intenta simular la misma conversación o proyecto de codificación de vibraciones. créeme Lo intenté. Quería asegurarme de que todas las herramientas que probé usaran el mismo mensaje, pero primero quería perfeccionarlo para obtener los mejores resultados, así que se me ocurrió un truco para llegar allí.
Primero, desarrollé todo el proyecto con Gemini en su nivel más básico. Una vez que me gustó dónde estaba el proyecto (una prueba de concepto funcional y exitosa), le pedí que generara un mensaje para poder agregarlo a otro chatbot. Gemini generó el mensaje, lo guardé como un archivo y lo subí a la nube. Pasé por este proceso nuevamente, lo que le permitió a Claude detectar y arreglar cosas en las que no había pensado mientras construía el proyecto y Gemini. Una vez que se completó el proceso, le pedí que generara otro mensaje para poder agregarlo a ChatGPT.
La idea era que los tres chatbots tuvieran alguna aportación sobre la creación real del proyecto y, por tanto, sobre el mensaje final. Una vez que se creó el mensaje, lo cargué en tres chatbots en un chat separado para ver qué tan consistentes se desempeñaban.
Proyecto: Lector de tomos
Este proyecto nació de mi frustración con los dispositivos Kindle de Amazon. Cualquiera a quien le guste leer y escuchar sus libros puede hacerlo con resaltado en tiempo real en aplicaciones para iOS o Android, pero después de tanto tiempo (casi 20 años después) no se puede hacer eso en un Kindle. De hecho, no hace mucho que los usuarios obtuvieron la capacidad de resaltar texto en tiempo real con el lector auxiliar en reproducción, lo cual está muy cerca de la funcionalidad de la aplicación. En este momento, solo puedes leer o escuchar un audiolibro en el Kindle, no ambos, lo cual es ridículo, al igual que la idea de que Amazon fuera dueño de todos mis libros. Me puse a pensar que podría simplemente crear un código de solución. Yo lo llamo el lector de tomos.
Quería crear una aplicación web de lectura electrónica inmersiva que leyera sus libros en voz alta (con texto resaltado en tiempo real, por supuesto) ya sea que el texto estuviera pegado o que se hubiera subido su propio archivo PDF o EPUB. Además de leer el texto en voz alta, la aplicación web generará música de fondo según el contenido del texto (neutral, terror gótico, ciencia ficción, naturaleza, fantasía, submarino, western, misterio) y generará sonidos y efectos visuales adicionales cuando ciertas palabras desencadenantes se pronuncien en tiempo real. Todo el proyecto se creó en un único archivo HTML para que pudiera ejecutarse en un navegador web sin dependencias adicionales.
Construyendo con Chatbots: Primera Ronda
Géminis
Gemini creó todas las funciones que quería de un lector de Samadhi con relativa facilidad
Gemini me permitió determinar hasta qué punto podía ampliar la funcionalidad de esta aplicación web y, por lo tanto, la mayor parte de su funcionalidad proviene del chatbot de Google. Esto me permitió solucionar algunos problemas menores al principio, lo que impidió que se cargaran las voces TTS. En cambio, creó una pantalla de presentación que obligaría a que las voces se cargaran después de hacer clic en una pantalla “abrir” en la aplicación. Sin ese conocimiento, el proyecto no habría despegado.
De forma lenta pero segura, la eficacia del proyecto aumentó. Dado que los efectos de sonido en vivo pueden resultar confusos para algunos sonidos, me aseguré de agregar una opción para desactivar esos efectos de sonido y la música de fondo. Después de tener una base para hacer que la aplicación funcionara, le pedí a Gemini que creara un mensaje que pudiera compartir con otros chatbots para poder crearlo en otro lugar si quería, y así fue.
claudio
El proyecto de Claude me ha dado el mayor éxito en algunas áreas y más problemas en otras, pero es mi favorito personal de los tres proyectos experimentales.
Claude ha realizado fantásticos refinamientos en la función subyacente de la palabra desencadenante en este proyecto. Claude amplía el vocabulario y aumenta la visualización cuando se pronuncia en voz alta una palabra desencadenante. Dicho esto, Claude hizo una llamada que yo no le pedí que hiciera, aunque el argumento realmente tiene sentido.
Inicialmente, pensé que el proyecto no estaba funcionando porque cuando fui a probar su funcionalidad, la primera palabra desencadenante produciría el efecto deseado en una cadena de aproximadamente 10. Tomó algún tiempo finalmente revelarle a Claude que había decidido permitir que los efectos visuales y de sonido solo se activaran una vez por oración para no enviar “spam” al usuario. Esto tenía mucho sentido, pero el proyecto fue más una prueba de concepto que un lector funcional, y Gemini y ChatGPT crearon efectos de sonido para cada palabra clave, que funcionó como se esperaba.
Dicho esto, no había instrucciones específicas dentro del mensaje para la cantidad de veces que se reproducían los sonidos y los efectos visuales. Si bien no era necesariamente lo que quería, aprecié la consideración de la experiencia general del usuario al realizar dicha llamada. Luego, después de codificar todas esas mejoras, Claude actualiza el mensaje y lo llevo conmigo a ChatGPT.
chatear
ChatGPT no pudo crear funciones adicionales cuando ocasionalmente se lo pedí, pero aun así pudo recrear el proyecto perfectamente cuando le di el mensaje final.
Cuando creé el mensaje actualizado con Claude, no se me ocurrió nada más que hacer mientras subía a ChatGPT. Afortunadamente, el chatbot de OpenAI facilitó el proyecto, a pesar de ser el más lento en términos de generación de código. Una función que le pedí a ChatGPT que agregara al proyecto: crear un control deslizante de volumen dedicado para la música de fondo que pudiera desactivarse por completo si alguien solo quisiera una experiencia de lectura electrónica dedicada, falló constantemente. Finalmente, volví a Claude para pedirle esta funcionalidad y recrear el mensaje.
Ronda 2: Rehacer el mismo proyecto
A pesar de utilizar inicialmente Gemini 3 Pro para crear proyectos y la versión gratuita de ChatGPT y Claude, los tres crearon proyectos, pero no sin problemas. Pasé la mayor parte de mi tiempo en Claude perfeccionando el proyecto y fui responsable de crear la versión final. Así que fue increíblemente sorprendente descubrir que al cargar ese mensaje en un nuevo chat, el proyecto no se cargaba más allá de la primera página de “empezar”. A pesar de que no hubo problemas con las iteraciones anteriores, se han realizado 11 (sí, de verdad) reconstrucciones completas adicionales para descubrir qué está pasando.
La reconstrucción del proyecto con Gemini y ChatGPT funcionó a la perfección. Todas las funciones, básicas y avanzadas, funcionan con la carga de archivos, el resaltado de pruebas, la conversión de texto a voz y los efectos visuales y de audio cuando las palabras desencadenantes se pronuncian en voz alta. Volviendo a los modelos, vi muy poca diferencia en función o rendimiento al darle a cada chatbot el mismo mensaje.
Inconsistencia del chatbot
Siempre fue fácil adquirir el archivo para probarlo con Claude. No solo ofrecía una vista previa del proyecto para que nunca tuvieras que descargar el archivo HTML, sino que, si querías (lo que hacía a menudo para probar), estaba disponible para descarga directa. Esta opción solo se ofrecía a veces con ChatGPT, otras veces podía simplemente copiar el HTML y guardarlo manualmente.
A pesar de los defectos menores y los problemas generales con Géminis, siempre hay que tomar un largo camino y hacerlo de esta manera. Aparte de eso, el hecho de que ChatGPT a veces me ofreciera permitir descargar el archivo directamente como HTML era extraño y un poco frustrante.
Ganador: Depende
Definir un ganador para este tipo de pruebas es difícil, ya que todos los chatbots tienen pros y contras. En cierto sentido, todos ganan. Todos lograron crear una versión funcional del proyecto en algún momento, pero a menudo requirió esfuerzos repetidos.
Al final, el ganador es el usuario. Esto demuestra que, independientemente del modelo utilizado, un conjunto sólido de instrucciones puede ser de gran ayuda. No pude notar la diferencia en rendimiento o función entre la aplicación creada por Gemini 3 Pro y las versiones gratuitas de ChatGPT o Claude.
En realidad, esto va directamente en contra de lo que encontré al tener conversaciones similares tanto con el Gemini Pro como con el modelo gratuito. Aunque fue otro día, otro proyecto y otro modelo, demuestra que un mensaje sólido puede llevarte increíblemente lejos en el mundo de la codificación por vibración.











