¿Cuál suena mejor, "Invisible Wings" cantada por Microsoft Xiaobing o "Invisible Wings" cantada por Lottie Lottie?
Acerca de Xiaobing, Xiaobing (Cai Lin) es el favorito de Microsoft Research Asia. No hay duda de que Microsoft le ha brindado una poderosa inteligencia artificial, y no hay duda de los esfuerzos detrás de ella. En el futuro, es muy probable que Xiaobing tome una ruta creativa además de ser simplemente un cantante de inteligencia artificial. Quizás en un futuro cercano, siempre que Xiaobing diga: Hazme una canción tipo XX, Xiaobing la creará rápidamente. Incluso puede sustituir la composición manual o las letras. Esto es de esperarse.
Para la familia V de Yamaha, se ha logrado una comercialización completa y se ha convertido en parte de la cadena de la industria. La definición de la familia V es muy clara: un cantante virtual, obviamente no dotado de tecnología de inteligencia artificial. Sin embargo, los consumidores (usuarios) correspondientes a V home son obviamente profesionales con ciertos conocimientos relacionados con la música ------. Los usuarios quieren crear su propia música y V home simplemente proporciona una manera para las personas que no pueden cantar bien pero aman la música. Por supuesto, en el futuro, es probable que V Home coopere con empresas de tecnología de inteligencia artificial para integrar tecnología de inteligencia artificial en él, pero esto no sucederá en el corto plazo.
A corto plazo, ambos no competirán por el momento.
Si simplemente comparas quién canta mejor, debes comprender la tecnología detrás de Xiaobing. Se basa en big data de Bing y utiliza la comunicación con los usuarios para aprender y mejorar continuamente. Su tecnología de síntesis de voz también se considera una de las mejores del campo. La persona a cargo dijo que la depuración de Xiaobing en unas pocas semanas o incluso días es mejor que la depuración de XiaoV en varios meses. Personalmente, creo que esto es creíble. Personalmente, creo que esto es creíble. El efecto a corto plazo de Xiaobing de simular voces humanas para sintetizar canciones a través de una gran cantidad de datos y mejorarse constantemente es naturalmente mejor que el de los profesores V que solo confían en sus sentimientos para enseñar. Pero la música se usa para expresar emociones. Por el contrario, la cuidadosa afinación de V reduce gran parte de la participación humana y su efecto de expresar emociones se reducirá considerablemente.
Si el programa de cantantes de Xiaobing está completamente abierto al público, habrá una gran cantidad de productos vulgares inundando las obras. Por el contrario, la familia V tiene un umbral de creación más alto y la mayoría de las obras que crean son de alta calidad.
En general, la voz cantada de Xiaobing puede ser un poco mejor, pero su capacidad para transmitir las emociones, el gusto y la autoría del autor es mucho peor que la de Tianyi.