南宫28免费AI“神器”第十三弹:会20种发言的数字人爆火;呆板人能提前08秒预
时间:2024-04-22浏览次数:
 免费AI“神器”第十三弹:会20种措辞的数字人爆火;呆板人能提前0.8秒预测人类脸色|钛媒体AGI  这日,钛媒体AGI梳理了免费 AI “神器”系列第十三弹,共五款,此中不少产物再一次拓宽了咱们对AI的设思力。  产物消息:Digen是由Digen AI研发的全新克隆数字人器材产物,称是操纵天生式 AI 手艺创筑面向改日的视频,声援众达20种措辞、40+种音响,手势、口型和语调所有同步类似,

  免费AI“神器”第十三弹:会20种措辞的数字人爆火;呆板人能提前0.8秒预测人类脸色|钛媒体AGI

  这日,钛媒体AGI梳理了免费 AI “神器”系列第十三弹,共五款,此中不少产物再一次拓宽了咱们对AI的设思力。

  产物消息:Digen是由Digen AI研发的全新克隆数字人器材产物,称是操纵天生式 AI 手艺创筑面向改日的视频,声援众达20种措辞、40+种音响,手势、口型和语调所有同步类似,视频成就比拟传神。

  产物性能:用户可通过官网申请内测,应用时免费实行本性化头像天生,大约须要5-7天功夫,随后能够实行视频编辑和天生等操作,最终能够竣工数字人视频形态,声称为Digen in Real Motion 1.0南宫28

  目前,Digen包罗免费版、创作家版、专业版三个版本,后两者每月计费辨别为9.9 美元、19.9美元,倘若按年订阅代价会更低少少。公司称,免费谋划的订阅者不受任何功夫局部,但每月只可筑制总长度为2分钟的视频,视频数目没有局部。

  产物消息:哥伦比亚大学革新呆板测验室即日推出一款能够预测人的脸色,并能与人类同步做出脸色的人脸呆板人。这款呆板人采用自我监视练习框架,运作道理仿佛于人类通过照镜子来老练面部脸色。

  产物性能:EMO能够正在人类微乐前839毫秒预测即将到来的微乐,并通过模子与人类同时外达微乐。另外,Emo还能够预测心酸、义愤和诧异等脸色,还能与人类实行眼神互动,但目前还不行做出人类的一切脸色。

  据会意,Emo的眼睛里装有摄像头,硅胶皮肤下有26个电机,仿佛于人类面部的肌肉,可认为呆板人的面部脸色供给动力。其余,该呆板人应用两个神经搜集,一个用来查看人脸并预测脸色,另一个磋议奈何正在呆板人脸上形成脸色。第一个神经搜集通过视频网站上的视频实行操练,第二个神经搜集让呆板人通过及时摄像机旁观己方做的脸色来操练。

  团队磋议职员显示,改日,他们还将拓宽呆板人的脸色限制,生机EMO能对人所说的话做出反响,而不是粗略仿效人类。另外,磋议职员正操纵大模子将措辞调换整合到Emo中,让Emo也许答复题目和对线、Domo AI 新性能上线:能让静态人像动起来

  产物消息:Domo AI是映刻科技推出的一款将照片和视频动漫化的AI器材,该器材能够将用户上传的图片和视频转绘为动漫气概,原委不停迭代更新,Domo AI即日推出了图像天生视频新性能。

  产物性能:Domo AI的新性能团结了深度练习和企图机视觉算法的前沿手艺,通过智能识别和领悟静态照片中的人物特点,再与动态视频中的运动数据实行精准成婚。正在壮大的算法驱动下,Domo AI也许美妙地将照片中的人物“移植”到视频中,竣工静态到动态的完备转换。

  比如,用户能够上传一张静态照片和一个参考的动态视频,Domo AI便也许美妙地将静态照片中的人物调换成动态视频中的人物,竣工惊人的视觉转换。

  Domo AI性能壮大,合用于众种场景和使用。不单可用于社交媒体上分享矫捷乐趣的动态照片,还可认为片子、逛戏或广告筑制增添殊效,为用户供给无尽的创意空间。

  目前,Domo AI新性能仍旧正在Discord频道上正式上线,用户只需正在频道内应用/move下令,即可轻松体验将静态照片变为动态视频的奇妙流程。

  产物消息:Ideogram是一款超强文字天生图像器材,旨正在天生包蕴能够清楚阅读文本的图像。该模子由谷歌前员工构成的创业团队打制,团队成员曾出席开辟谷歌的 Imagen 图像天生软件和视频天生模子。

  产物性能:Ideogram的要紧性能为文生图性能,但与其他图像天生模子差别的是,Ideogram擅长天生包蕴文本的图片,用户只需输入提示词,Ideogram就能够服从央浼将文字融入天生的图片中,竣工平面、悬浮以至立体文字成就。比方天生片子、产物海报、T恤印花等图像,管理了生图AI正在图像文字天生上的痛点。

  近期上线版本正在精确显示文本方面有了明显提拔,天生的图像也尤其传神,能够对繁杂提示词实行正确反应。Ideogram 显示,出席测试的评估者对待 Ideogram 1.0 正在提示对齐、图像连贯性、全部偏好和文本衬着质地方面的偏好超越了 DALL·E 3 和 Midjourney V6。

  同时 Ideogram 1.0 还引入了 一个名为“邪法提示”的新性能,该性能能够依照用户的原始刻画,编写更精确的提示词,进而创作出更面子且具创意的图像。

  另外,Ideogram 1.0版本还能剖析冗长、繁杂的提示词,天生清楚、传神的图像,包罗动物、离奇组合的闪现,以及照片级传神的人物脸色和手部举动。

  付费方面,用户每天能免费应用25个提示词,天生100张图。8美元月付用度户每天能够天生100个提示词,400张图。20美元月付用度户能够无尽应用。

  产物消息:LaVi-Bridge是一个无需操练将差别的措辞模子和天生视觉模子团结起来,以竣工文本到图像的天生的手艺框架,该框架由香港大学、香港中文大学和香港科技大学的磋议团队协同开辟。

  产物性能:通过应用LoRA(Low-rank Adaptation)和适配器,LaVi-Bridge供给了一种灵巧且即插即用的本领,无需窜改原始模子的权重。这个框架兼容众种措辞模子和天生视觉模子,也许顺应差别的机合。

  正在这一框架内,团队阐明了通过整合更高级的模块(如更先辈的措辞模子或天生视觉模子)能够光鲜普及文本对齐或图像质地等才能,原委大方评估验证了LaVi-Bridge模子的有用性。

Copyright 2012-2023 南宫28(中国.NG)官方网站 版权所有 HTML地图 XML地图--备案号:鲁ICP备09041058号  备案号:鲁ICP备09041058号  
地址:山东省淄博市高新区柳泉路125号先进陶瓷产业创新园B座606室  邮箱:qht@3583100.com  电话:0533-3583100