华为FreeBuds 5的内部结构设计进行了大胆的创新,采用了声电控三分离设计来优化器件布局,将发声单元模组单独放置在耳包中,电池模组放置在耳柄中,控制电路板放置在起到衔接作用的耳杆中。
2022年全年集团核心经营亮点:营业收入38亿元(人民币,下同)。商汤保持在包括智慧医疗、C端产品的布局和探索,商汤智慧医疗在2022年实现突破,收入大幅增长,SenseCare智慧诊疗平台已向医院客户提供多种智能化产品及服务,并已获得国内NMPA三类、二类医疗器械注册证,欧盟CE、新加坡、沙特、阿联酋等国内外医疗器械认证共计22项,并落地上百家医院与医疗机构,在2022年度协助医生分析了上千万人次的医学检查。
商汤绝影继2020年7月通过了ISO 26262功能安全ASIL B产品认证和ASPICE CL2认证后,于2022年12月获得了ISO/SAE 21434:2021汽车信息安全流程认证证书,成为了AI行业内少数获得三证的企业。多模态大模型:这类模型能够处理多种数据类型,包括文本、图像、音频和视频,具有更强的数据理解和生成能力,和多任务泛化能力,商汤将多模态大模型的研发作为战略投入方向。强化学习和决策智能:成功研发一系列高效的决策智能模型,在机器人控制、游戏AI、自动驾驶决策系统等领域取得显著应用成果。智能汽车平台前装量产收入大幅提高: 2022年,智能汽车板块实现收入3亿元,同比增长59%,占集团的总收入的比例由2021年的4%大幅提升至8%,平均单车价值显著改善。智慧生活、智能汽车的收入贡献有较大提高,占比分别从2021年的9%和4%提升至25%和8%。
人工智能治理与信息安全保护提倡负责任且可评估的人工智能,积极推动AI可信工作2022年8月,商汤AI训练平台(AutoLink)获得了人工智能产业发展联盟可信AI平台应用标杆案例奖。2022年公司全面布局生成类预训练大模型,围绕文本、语音、图像、视频、3D场景的内容生成形成完整能力,整体升级了SenseMARS混合现实平台的产品及功能,面向行业客户服务并带来收入增长。因此我自己做的是行业软件,但我依然认为未来最大机会是更自然的沟通方式是voice,因此在UI和工程领域如何更快的把rich text area这个component变成 rich voice area component是更底层的更有意思的机会,甚至可以支持手势,表情等,更多的输入形式从而变成rich communication area component,这也是我思考了很久的领域,现在已经有了结论,不过我们就不在这里展开了。
耳机不再只有降噪这个卖点,而是交互的终端,是conversation的承载,是任务指令的下达。现在的耳机已经可以透明收声,如果耳机具有一定的边缘LLM能力,《Her》的电影场景就可以实现了,基于语音的交互是最自然的对话。与手机相比,微信的新特性是扩大了通讯录,使通讯录中的联系人数量增加了百倍,更能够进行面对面的沟通。不夸张的说,这可能是,或者至少是科技行业的人类的群星闪耀时,而且后续也将影响更多行业和从业者。
不过这个完全是个人脑爆,毕竟旅游行业的供应链管理是相当复杂和高壁垒的,我们有相当长的时间可以观察,思考和应对。因此我们应该不仅限于打字,因为打字本身是有PC了以后才有的形式,几千年的人类沟通方式是语音。
iPhone的早期,很多人吐槽当点iPhone上的app都很PC,直到有的app用手势gesture来做交互才逐渐有了现在的样子。同时,我们还可以利用机器学习进行员工满意度和工作绩效分析,提供数据驱动的洞察和建议。突然之间,ChatGPT的出现,让大家对这个社会秩序迭代的公式产生了动摇。当然LLM自身的竞争不在考虑范围内。
因此,解决这些问题需要依靠对话式用户界面(CUI)的发展,我相信很快就会出现AI的类似于iPhone诞生后的Gesture时刻。LLM会逐步的部分或者全部替代掉SaaS的业务逻辑,但是传统的业务逻辑是不是更高效这点需要针对不同的业务逻辑单独的比较和验证。让我们首先来看一下LLM的能力和特性。比如我要LLM帮我请假,但是一些具体请假原因和流程都要在对话框里完成。
毕竟也有很多时候自然语言不一定是效率最高的方式。很多传统的社交软件也都在利用数据来降低社交成本,比如点个赞,比如用手滑照片。
个人感觉如果百度未来的搜索结果可以放更多的软广,在上下文中,让用户更加接受,而不是现在的搜索广告形式。如果需要更多交互,可以打开完整功能。
首先是语言 language,自然语言的交互方式,很底层的人类交互手段。而且很多业务逻辑用自然语言描述和用数学函数描述效率并不一样,因为自然语言对复杂功能的描述其实不如直接抽象出来的逻辑和算法更高效,而且自然语言本身也需要被转换成机器能理解的逻辑和算法才可以被机器识别和运行。下面我们从三个维度来具体分析一下。然而,如果只考虑到这一点,那么你对于使用场景的了解可能还不够深入。如果你的交付不是纯信息类的,是封闭的,是专有知识类的,那么长期看是非常有价值的,不仅没有风险,而且LLM会大幅度的提高你的生产效率。如果能通过耳机+各种sensors,还有环境音的透明收声,则可以有更多的应用场景被挖掘出来。
如果这样想的话,微信可能会成为下一个时代的王者,甚至可以取代百度,因为人们可以在微信上解决所有问题,包括像对话一样自然的搜索,而不需要切换功能和场景。而业务逻辑依然依靠现有的系统来完成。
现在看来,不论2B和2C,只要你的数据是公开的,泛行业的,你的替代性就越高。经过这4个多月的时间,很多原来的工作习惯被迭代,很多原来的认知被重置,很多原来的范式被改变。
线行流程配图星型流程配图大多数功能都可以用类似的方式完成调度,只有极少数需求需要权限和分组等功能在授权的时候需要一些传统的验证和流程,其他的应该都可以满足需求。所以符合私有数据和线下交付中的一项的LLM应用已经很有生命力了,符合两项的又有专有数据又有线下交付的应用肯定是极大的利好,线下交付的能力不是短时间可以培养出来的。
产品/软件设计的转变,在这一部分我们要探讨如何利用LLM的特性来改造我们原有的古典软件行业,我们哪些要LLM化,哪些要坚守古典的结构化思维。从交互的角度:尽管我之前提到了交互式用户界面(Conversational UI),这种界面最自然的表现形式仍然是对话(conversation)。基本上做到了第三步才是真正的用AI/LLM来定义和实现完整的软件功能和逻辑,而不仅是交互方面的调度,我觉得可能在相当长的一段时间内都是用第二步和第三步之间的方式来实现软件/SaaS的AI/LLM化,而不是Native AI/LLM软件/SaaS。原因是如果出现超级LLM,那LLM本身就有是平台,对现有平台产品来说可能会损失品牌,躲到LLM后面,沦为工具,但不管怎么样,平台还是应该拥抱LLM,利用好LLM的能力,也可能走出一条不一样的路。
Make a better life for all people and their families.关于GONEX- IRIS:GONEX-IRIS是全球首创的AI Native的人工智能HR合规服务引擎,可以帮助HR团队轻松应对日益增长的挑战,提高工作效率和便利性。但是反过来想一下日常的对话都是自己发起的么?显然不是,实际生活中不同的场景,很多都是用户是被动应答的。
只要你的value只是线上薄薄的一层,哪怕再高的知识密度,你的可替代性也不会很低。从工程角度来看,实际上是对一些专业概念进行了对应,以便于产品经理和研发人员的理解。
对于CUI,我认为未来的交互可能不仅仅是typing,还有声音,图像/视频等输入形式。很多人都在讨论LLM和AI infra,如何写诗如何画画,真正讨论应用的很少,讨论行业应用的就更少了。
总体上讲,LLM对未来的或现存的平台类应用是比较负面的。交互范式的转变,在这个部分我们要一起探讨交互和用户体验的大幅变化,如何利用LLM来大幅度降低使用成本,并大幅度提高使用体验,古典和LLM怎样融合,CUI是最终的交互形态么?或者说CUI的最终交互形态是什么?产品的PMF范式的转变,这个部分我们会把我们对LLM会从产品落地到用户需求匹配,门槛降低带来的竞争格局的变化,以及LLM会促进什么样的PMF,会打破什么样的PMF。面对诱惑大多数人都会放弃坚守,但我还是希望大家在设计产品时问自己一个问题,我的产品能不能带来10倍体验提升,能不能带来10倍成本的降低,普通人只能点滴的改变。甚至也会由于数据合规性的考虑会出现个人LLM和边缘LLM。
这样系统的输入方式和形式以及效率都会得到大幅度的提升。当然也不一定是左右的形态,也可以是下上,或者上下的形态。
在这种情况下,直接从本地数据库检索可能更加高效,对算力的要求也更低。但并不是所有的任务都适合使用 AI,因为有些任务用 AI 完成的效率并不一定高,比如查询中国的最低年假。
主动发起对用户体验来说是一个很大的飞跃,(这里主动发起不是类似手机的push msg)尤其是情感领域,被动和主动区别很大,大多数国人在现代社会中都是社交被动型的,社牛太少了。很多流程会从线性的变成星形的。