详情内容
微信公众号、音频(歌曲)、短视频AI创作尝试之一 这个公众号是2024.9.23日申请的(通过查看公众号消息通知得知,自己已经忘了),2025.2.10日写了第一篇文章,当时在做美股交易,主要是大饼相关的股票,所以公众号命名为“矿股”,但是也没做下来,没有足够的时间来做。今年开始有了点时间,看到一篇马斯克预言时代变化的文章,说2000天是一个过渡期。我的理解主要是AI技术对个人工作、学习、生存、生活的影响。我自己从2025年春节左右开始用AI,后续相继尝试了用AI生成文本(教材、工作上用的一些文档、小说)、音乐(歌曲、纯音乐)、视频(短视频)、编程(网页制作、安卓APP开发、手机游戏开发)。我的体会是AI会影响和改变多数人在工作、学习和生活中的各个方面。所有把这个公众号的名字改为“接下来的2000天”,记录这2000天(不一定是2000天,也许更久,也许不足[不接着写下去了或者公众号这种形式不存在了])里自己学习和应用AI的过程和体会。 从2026.1.15日开始,分别尝试了用AI写小说、写美股评论、制作歌曲、制作音乐、制作视频。有的做成了,有的没有。这里的“成”可以按两种方式理解:一种是完成了作品,一种是得到很多人的关注。前面做的那些是前一种理解,看来完成作品后续可能还需要学习如何推广。也许作品本身就不具备爆款的潜质,或者一切都是探索,文字、音频、视频这些内容创作也许都已是红海,现在进去有立足之地已经很难。 虽然很难,还是都尝试一下吧,现在学AI感觉就像古代学书法,现代学打字一样,是一项基本功,人提供的只是想法。〇几年的时候看到一种说法,说将来人们生存的三项必备技能:英语、计算机、开车。现在AI发展这么快,这几样慢慢或已经被AI取代,拿里面最难的计算机编程来说,很多工具已经只需要人提供想法了。未来的几年(2000天约等于6年)对AI的使用会是最基本的生成本领。这个也有点存疑,未来人的价值和能力究竟在哪里?也许学了AI最终也是无价值的人,有点悲观了,但是现在也不能什么也做,是吧? 闲话少说,列一个这21天(这个21天也是凑巧今天发了音乐作品等待提交,而且以前学计算机编程语言比如Java,经常会遇到21天学会之类的书)学习和创作的经历吧。 1. 文本创作:小说《边尘录:宋辽夏金战争小人物纪事》,这个是用豆包生成的,思路是本来想写武侠小说,试着写了一下,很一般。然后想写历史小说,就按最喜欢的武侠小说《天龙八部》的历史背景,选了宋辽西夏金这几个同期朝代为背景,创作一个小人物在这个时代里串联起来几次不知名战役的故事。 “成”了吗?作品是创作出来了,但是除了自己,没人看。原因在哪儿呢?自己也看了,觉得看了几集看进去之后,也挺好看的。但是现在微信公众号已过了高峰期,而且推荐算法也对普通的新品不利。还有个原因是短视频的影响,短视频可以直接达到人的情绪兴奋点,文字太慢也太淡了。 2.1 歌词:对DEEPSEEK或者其他平台说出自己的想法就可以生成歌词。 昆仑天工(https://www.mureka.cn/):本身也可以生成歌词,自己提供歌词也可以。生成的音频文件可以分音轨。这个很重要,如果要制作歌曲视频,最好把人声分离出来好对口型。Vemus未音(https://y.qq.com/vemus),腾讯的作品,这个平台也可以作词,优点是可以直接发布到QQ音乐等平台,但是对AI生成的音乐,需要每首支付29.9的费用。试了一下,第一次很快审核未通过,原因是“音频质量低”,想了一下,可能是自己上传的MP3格式的音乐有压缩很质量损失,重新上传了WAV格式的音频,过了几十个小时的“母带中”,结果还是“音频质量低”。也许得经过很多次尝试吧。还有,这个平台收益分成是50%。 suno(suno.com):国外的平台,很多评价里得分最高。试了,也很好用,可以分离音轨。 抖音音乐开放平台(https://music.douyin.com/),可以创作和发布,尝试用了其它平台上创作的,正在审核中。昆仑天工平台创作的,发布到喜马拉雅,问了DEEPSEEK在喜马拉雅创作哪种类型的音乐最受欢迎,答案是助眠音乐。刚看了结果,只有1.31日自己播放的两次。 视频有很多种,选了歌曲MV。因为前期有了歌曲的音频,所有搜了可以对口型生成视频的平台。 3.1 D-ID(https://studio.d-id.com/),可以创建Avator(人像),选择人像和上传声音(音乐平台创作的音频分离出的人声音频)后,可以生成歌唱视频。优点是操作简单,缺点是只有嘴和眼睛会动,其它头部和身体部位不会动,导致不真实,而且由于头部其它部位不会动,会失真。也许高级会员的功能会好些?还有个限制是导入的人声音频文件不能超过15M。 3.2 heygen(http://www.heygen.com),这个平台生成的动作自然些,头部和身体都会动,缺点是如果人脸不是正对着镜头,生成视频中的人会时不时转过头来看镜头,非常不自然。也许是选动作引擎时没尝试其它功能更强的,也没买会员,不知道会员的功能会怎样。非会员每月有3次生成视频的机会。 除了文本、音频、视频,其实还需要用到图像。比如微信公众号文章里需要,还有视频里需要人像,只用了常用的豆包和百度。豆包可以按照你的描述生成图片,但是也许我的描述不对,我提出人在图片中占的比例或者面积小些,怎么描述也不管用。豆包生成的图片有水印,可以在百度里去掉。 流水账记录了这么多,对自己只是个记录。对这个公众号的用户来说,只是简单提供了一些工具和使用经验,如果您感兴趣,可以用AI平台搜一下怎么用,我现在不想也没时间写详细的教程,虽然教程对于公众号来说,看的人会更多。但是我的想法是,过去的年代学什么的最好办法是有个教程。但是现在什么都可以在AI平台搜到。但是我的经验是,AI平台有时也会不懂装懂,比如你问某个平台某个功能怎么用,它会虚构出这个平台的功能入口来。还有,AI平台很多是基于网上文字训练的,有些视频里的专业人士的最新见解,它未必能读到。比如我让DS分析一下当前文本、音频、视频这几种市场饱和度和创作难度,它给的答案是文本和视频是红海,音频是蓝海。我再接着问音频细分的分析,回答是音乐创作的门槛最高,得,就它吧。结果刷到专业人士的短视频,说2024年AI创作的歌曲在各平台就提交了500万首,有收益的不到3%。即使这样,我还是想试试。各种形式的信息方式的AI生成都想试试,最初是想有些收益,现在是先学会怎么做,了解AI能做到什么程度,有了这个工具基础,以后有了新的想法会容易些。 至于这个公众号,可能是起个大早赶个晚集(我在2105年就开了一个公众号,发展到400多用户,后来没时间就没往下做),只记录一下自己的心得吧。现在有几篇没人看的历史小说,还有一个标普500成分股的系列分析文章,估计看的人也不会多,至少自己能看。 我是今年才开始看短视频,以前很排斥,喜欢看文字。看了很多,觉得有利有弊吧,也总结了一些规律,以后争取每周写一篇短视频分析的文章。写的准备过程,也是对事物规律的总结,创意也许会从中产生。 还有,以上平台有些是需要付费的,下篇文字写一下各平台的收费方案和自己的投入。