最近的 ChatGPT 出圈了
对 AI 完全算是圈外人,核心技术不是很了解,最多知道什么叫神经网络,训练数据,模型,标签等最最基础的概念。也不知道是否需要,或值得去对 AI 的底层技术作进一步的了解。
前段时间也刚好偷闲,安装并测试了一下 Stable Diffusion 的 text-to-image 的能力,伴随着这次出圈,草率的整理一下我的理解。
ChatGPT 还是一个 Demo 并不能算是完整的产品,它提供了一个大家便捷的尝试使用的机会(类似 Stable Diffusion,但相对普通人来说,安装使用存在门槛,具体画面的结果也不具备话题进一步讨论出圈的广泛性和冲击力)。当然我还不是 ChatGPT 20美元一个月的订阅付费用户。也许付费用户的使用体验能发现更多。
另一方面,有位朋友浏览了 OpenAI 的 API,给了一些对 API 的理解,从 API 看 OpenAI 可以做更多的事情,但如何包装、或者整理成可用的产品,还在等待进一步的尝试。相信各个产业的开发人员应该都已经在实际的测试、设计和实现的流程中了,进程肯定远比我在这里叨逼叨来的更远、更实际。
微软这次用超级快速的行动,推出了 new Bing,我第一时间加入了队列,有幸已经排到体验了几天。相对于 ChatGPT 来说,new Bing 结合搜索给出的 chat 界面,以及纯 chat 界面来提供另一种信息获取的手段,对我来说是更有价值的产品。自从有了搜索引擎以来,作为用户,我们一直在不断的去适应搜索引擎,尝试不同的关键字,自我优化关键字来尽可能快、精准的获取我们想要的结果,而大部分被搜索的内容也有 SEO 这么一个新的学科,来将自己的内容对搜索引擎优化,从而更容易地被搜索到。但 new Bing 在目前成熟的搜索引擎的能力之上,向用户提供了一种基于自然语言的聊天的方式,提供了用户想要的结果,并且在这些结果之上辅以传统搜索引擎的链接引用。这种新的对话式的搜索方式,看起来会改变目前的用户搜索习惯,给用户提供更高效的,信息密度更集中的,阅读和筛选更便利的,可读性更强的搜索体验。就 AI 技术落地在搜索产品上,给出了一个标志性的产品结论,相信 Google 应该要很快加入这场搜索引擎用户体验的产品形态的变革。
而 text-to-image 的部分,我认为受制于训练数据的版权问题,将来落地成产品的形态很有可能和训练数据的版权以及训练后的模型授权会有较大的关系。现在还看不到特别能落地变成生产力的形态。
关于 AI 技术的产品化,眼下能够看到的有两个趋势:
第一个趋势是在非常狭窄的领域面向终端消费市场,比如 new Bing 的 chat,或者各种头像识别、车牌识别类的核心能力的产品。
第二个趋势是嵌入某些专业领域,让 AI 技术在这些专业领域形成辅助工具来提高生产。这类产品看起来不会面向终端消费市场,而是面向开发人员市场。比如嵌入程序员的工具,提供 AI 生成代码的能力,对更多人来说,嵌入 Office 提供文档纠错或者大纲编写的能力。
对每个人来说,能不能用好新的 AI 工具,看来将会定义个人能力的一部分了。