分类分类
关注+2024-12-20作者:教学助手
今天凌晨2点,OpenAI开启了第11天的直播技术分享,对ChatGPT的应用程序进行了重磅升级,支持原生应用程序自动化协作功能。
其实,从OpenAI在直播中演示的案例来看,基本上与AIAgent功能差不多,尤其是在编程方面非常好。不再仅仅局限于简单的问答模式,而是能够主动理解用户的需求。
例如,在与Warp控制台和XcodeIDE的交互中,ChatGPT能够迅速判断用户的意图,无论是分析代码库的提交数据,还是解决复杂的编码逻辑问题,都能高效地自动解决这些难题节省大量开发时间。
值得一提的是,ChatGPT的协作模式除了文本模式,还支持高级语音模式,就像“贾维斯”那样用语音和他交互提出你的各种需求。
fmt=png&from=appmsg" data-type="png" data-w="554" data-original-="" data-index="2" src="https://pic.chinaz.com/2024/1220/2024122008434703360.jpg" _width="554px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>
在直播中OpenAI是直接上功能演示案例,那下面「AIGC开放社区」就为大家解读一下这几个自动化写作示例。
编程自动化协作
在演示中,OpenAI的开发人员首先打开了Warp控制台,并导航到了正在使用的代码库。想要了解该代码库在过去两个月里每天的提交数量,但不知道如何获取。
于是,点击ChatGPT桌面应用中的协作按钮,会自动列出当前运行且ChatGPT可与之协作的应用程序。在选择Warp后,ChatGPT能够根据Warp中的上下文判断出用户正在使用Git,直接为其提供了获取每日提交数量的命令,并将命令复制粘贴到Warp中执行得到了相关数据。
为了更直观地展示数据,约翰进一步要求ChatGPT使用高级数据分析功能将结果以柱状图呈现,并指定为节日主题。也就是说,过去需要手动操作的固定、繁琐代码流程,现在ChatGPT可以自动帮你完成了。
接着在Xcodeide开发环境中,打开一个示例应用程序,该程序使用MacOS可访问性API来查看Xcode并获取屏幕上的信息,例如,文本字段的尺寸、行数及内容等,这些信息被用于开发与Xcode交互的功能。
当用户要求添加观察者功能,例如,选择变化加载文本区域时,ChatGPT利用其思维链模型(o1模型)生成相应代码。好像在直播的时候,第一次展示并没有成功。不过第二次尝试就顺利实现了。这个案例也体现了ChatGPT全新的感知和自动化代码能力。
目前在编程方面ChatGPT的协作功能支持主流开发环境,包括VSCode、Jetbrains、RubyMine、BBEdit等,估计以后还会添加更多IDE开发环境。
写作场景协作
当我们在写一份深度报告或者内容时,总是希望有一位老师可以指导我们,例如,有哪些错别字,内容是否真实,标题起的好不好,以及实时获取想要的资料等,现在ChatGPT的协作功能就能轻松帮你完成了。
在直播案例中,开发人员正在使用Notion编写一个关于旧金山历史的步行游览文档,其中一个重要部分是介绍“诺顿皇帝”。他将ChatGPT与Notion完成集成,能够访问并理解整个文档的内容。
但在编写的过程中遇到了困难。他不清楚如何生动准确地描述诺顿皇帝的生平事迹,如何挖掘有趣的细节以吸引游客,同时也担心自己所写内容的事实准确性。
FMxOmh5AmMw9B7Krg/640?wx_fmt=png&from=appmsg" data-type="png" data-w="554" data-original-="" data-index="3" src="https://pic.chinaz.com/2024/1220/2024122008434703361.jpg" _width="554px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>
于是他选择了文档中的一个特定部分——关于“诺顿皇帝”的介绍,并启动了ChatGPT的协作功能,基于这一上下文生成讨论要点。
ChatGPT立即开始分析文档上下文,凭借强大的语言理解和生成能力,迅速为用户提供了丰富的信息。不仅补充了诺顿皇帝的生平细节,例如,他在旧金山的活动轨迹、与当地居民的互动等,还对其自称皇帝的行为和影响进行了更深入的阐述,为写作提供了丰富的素材。
为了验证ChatGPT编写的准确性,于是开启了网络搜索功能。当ChatGPT回答问题时,它会在互联网上广泛搜索可靠的信息源,并为生成的内容提供引用链接。例如,在介绍诺顿皇帝自制货币的流通情况时,ChatGPT引用了相关历史文献和研究资料,确保了信息的可信度。
但ChatGPT生成的内容风格比较生硬,于是要求它匹配整体上下文的协作风格。接着ChatGPT读取了文档的整体风格,包括语言表达方式、叙述节奏等,然后对之前生成的内容进行了调整,优化了语句结构,使表述更加流畅自然保持一致的上下文写作风格。
ChatGPT除了支持文本提供需求之外,还支持高级语音模式,可以直接与它对话完成你所有的需求。例如,在演示的过程中,一位开发人员想演奏萨克斯曲目,但是很多他不知道该选哪一首,通过语音模式让ChatGPT帮助选择并解释为什么是这些歌曲。
目前,ChatGPT的协作功能已经在Mac应用程序中可以使用了,通过Option+Space就能快速调用这个功能,并且占用的内存非常小,是一个不错的自动化协作助手。
相关文章
更多+相同厂商
热门推荐
点击查看更多
点击查看更多
点击查看更多
说两句网友评论