Tiktok和Kwai背后的技术,以及AI内容产品的灵感

#这篇文章是由最初的激励计划产生的,每个人都是产品经理

不知不觉中,AI技术已经渗透到了我们的生活中。例如,短视频平台上有AI/AR道具。创作者可以使用这些道具来创建更有趣的内容。具体来说,哪些人工智能技术可以应用于内容类型的产品,以增加创作的多样性?让我们看一下作者的总结

> P>最近由于工作原因接触葵花艾技术(主要是CV方向),并采访了技术工程师的快速团队。事实上,TiktokKwai仍然非常领先于这项技术。甚至很多场景都比箭袋早。该技术比字节技术更具优势。提示:p>

但为什么人工智能的先进技术如此之贵?而不是在大众市场上摇摇欲坠,或者我们在商业市场上谈论什么?互联网的竞争如此激烈,人们原则上都是桂平,占据着用户的时间维度。人们知道字节的光、切和唤醒,但很少有人知道快手也有甜美、快速的阴影和原始胶片。P>

图1 Kwai top有一系列基准产品

首先要澄清的是,人工智能技术不是一切。许多商业上的成功并不意味着公司会因为其强大的技术和强大的算法而在商业上取得成功。这不是一个充分必要的条件,但最多是一个充分条件

商业成功,或我们长期定义的成功,更包括组织成功(人才管理、激励、组织协作、效率最大化)、产品成功、洞察和人性应用,了解商业模式等,所有这些要素最终都可以使产品真正成功,并且生命周期足够长

例如,微信就是一个典型的例子。微信有人工智能技术吗?当然,但这些都是存在的润物无声。微信不会将AI用于AI,例如扫描入口、识别地图、识别街景、识别商品/长按翻译/语音转换为文本等。这些都是AI技术能力的产品,但这些不是微信的全部产品,或者,这些技术只会帮助微信更好地为用户提供沟通工具,让人们的沟通和互动更加无障碍

提问。大多数人是拍视频还是打电话给摄像机主动拍视频?P> 蒂克,我相信你应该有同样的答案。大多数人使用葵花或消磨时间。tiktok中仍然有一些AI/AR道具,但大多数用户都在使用这些道具来品尝新产品,例如一些相同的UGC。对于专业内容创作者来说,他们主要通过内容本身的安排和设置来吸引观众,而不是太依赖AI模板或各种道具。即使有必要使用各种AI编辑和其他特效技术,它也可以用于视频创建过程中,也就是说,作为支持AI的视频编辑工具,例如类似剪辑

,但为什么Gan生成的AI比Kwai快得多?标题不是从算法开始的吗?通过对两家公司一周多的背景分析,以下原因总结如下:

1)基因的快速启动是由follower GIF编辑工具启动的,它本身就是一家技术驱动型公司。葵华和郑一笑的创始人都有技术背景,所以工程师的天堂就建成了。重点增加对CV等技术的投资,利用技术驱动产品,通过一些AI支持的爆炸效果+特殊操作刺激用户活动;这是葵氏公司的基本逻辑。Tiktok Tiktok Kwai,p>

2,这个老家伙需要是一个快速的司机。平台特性与抖动特性完全不同。抖动与马太效应一致,即20%的主网络指向头部。P>

葵则相反。致力于构建公平的平台机制。如果交通量太高,它将受到限制,更多的鼓励是民间生产的内容,以及建设一座城市或与你亲近的人的故事。这些人可能和你我一样。他们背后没有MCN机构,也没有独创的剧本和专业的编辑。因此,这些“平民”需要AI祝福和一些工具来以较低的成本创建内容和记录他们的生活

需要更强大的内容创建和生成技术来帮助普通人实现他们的明星梦想或制作同样的葵花。p>

虽然人工智能技术不是万能的,但短视频的核心是内容为王,各种播放方式都是围绕内容构建的;然而,AI技术可以帮助您高效地制作内容,并创建有趣的内容。接下来,我想谈谈哪些AI技术可以应用于内容类型产品。对象/运动检测技术应首先用于短视频内容创建,包括许多具有类似功能的自拍相机。例如,眨眼、伸出舌头、使用各种手势触发一些特殊效果都是基于面部的。类似地,基于一些图标和生命中的对象检测触发一些特殊效果

图2心脏比较效果

II。美容、化妆、身体、牙齿等肖像美化功能

其实都是基于关键点技术,无论是人脸还是人体的关键点检测技术,无论是5点、21点、137点、200点、1000点,还是从2D关键点到3D关键点,这里是为了帮助机器确认面部特征和面部轮廓的位置,以调整比例,如大眼睛、瘦脸、瘦腰、拉腿等

这些比较基础较少依赖于关键数量。如果你想使它更精细,例如,需要眼妆(睫毛、眼影、眼线、眼睑下垂和家蚕)和其他小部分的化妆,则需要增加关键点的数量。即使你想做一些诸如前额、高鼻子、低颧骨和苹果肌之类的事情,你也需要一些3D网格(从原点形成一个网状结构)。p>

图3 2D人脸关键点和3D关键点,最基本的人像美化技术

图4人体关键点技术

或者如果用户体验到的人体美容不仅可以拉腿、纤腰、丰胸,还可以防止背景失真,有必要引入匹配和修复技术(包括铺垫和完成),在某些场景中,也可以使用三维人体重建技术。例如,剪裁软件中的背景改变功能还取决于抠图能力

牙齿美白和唇膏取决于分割技术。例如,当我最近使用牙齿美白功能时,当我的嘴前面有一个遮挡物时,遮挡物上会出现一个白色的新月形不明物体。这是因为牙齿不像嘴那样判断咬合状态,呈现出一张通常被称为“戴着一帮”的图片,这非常令人尴尬

所谓的ar类被统一定义为现有真实空间中3D渲染CG材质的叠加,无论是叠加在人脸上还是在环境中

其中一些底层技术取决于3D人脸关键点的定位技术,另一部分依赖于空间的三维定位技术。如何确保叠加的3D材料在不同手机姿势动作和用户各种动作下的固定绝对位置(因为现实生活中的物体是绝对静止的,不会随着手机的移动而移动),这是技术测试的最大部分。

当然,3D材质的细化在很大程度上也取决于CG的生成效果。

图5谷歌基于安卓开发者提供的arcore功能,目标苹果拥有arkit

同时,这种技术也非常适合与广告商结合。广告商利用主题的风格或元素搭建平台投放,优先使用大V,引发网民参与,最终形成二次传播,品牌的产品和形象在网民中引起广泛讨论。

例如,在INS上,古驰、LV和迪奥已经定制了许多AR贴纸集,这些贴纸集富含自己的品牌元素,供用户使用。用户还可以在拍照、录像、播放的同时体验产品的虚拟试穿效果,进一步推动购买转型。

图6。古奇镜头(特效)

四、生成网络(GAN)

随着蚂蚁、Zao和其他AI面孔的一夜暴涨,在社会上引发了广泛的伦理道德讨论。社会一直对甘一代的特效非常热衷,比如你老了就“三岁”,迪斯尼风格,郭曼峰,手绘妹妹等等。

由于甘一代自身网络的特点,非常适合P

你可能还喜欢

发表评论

您的电子邮件地址将不会发布。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据