还在为调试提示词头疼?一个案例教你轻松上手!

还在为调试提示词头疼?一个案例教你轻松上手!

一言准备中...

如何从提示词小白变成高手?

最近豆包发布了全新的模型,迫不及待地进行了测试。我最喜欢使用的功能就是深度思考模式,这个模式能够在处理复杂问题时提供极大的帮助。而且现在它还赠送了很多免费的推理额度,完全足够个人使用,真是非常划算!

今天,我们将在提示词的功能优化过程中应用这个新模型,看看整体效果如何,毕竟免费的资源可不能浪费,赶紧利用起来。

还在为调试提示词头疼?一个案例教你轻松上手!

快速体验地址:https://www.volcengine.com/experience/ark?model=doubao-seed-1-6-flash-250715

我直接查看了下提供的 demo,发现对视频的理解基本符合我的预期,这也说明当前模型确实已经取得了显著的优化和进展。相比于豆包刚发布时,那时候的效果实在让人难以放心,而如今显然已经有了很大的提升,效果稳定性和准确性都得到了明显改善。

还在为调试提示词头疼?一个案例教你轻松上手!

接下来,我要带大家进入今天的主题:如何从提示词小白快速入手并逐步成为高手。今天我们用火山方舟的另一个平台——PromptPilot,来帮你了解如何构建有效的提示词。

官方地址如下:https://promptpilot.volcengine.com

还在为调试提示词头疼?一个案例教你轻松上手!

提示词优化:从基础开始

好的,今天我们将带大家深入了解如何通过这个平台,让你从提示词的初学者迅速成长为提示词的高手。正如我之前所提到的,掌握正确的技巧,并充分利用平台的各种功能,能够大大提高你的工作效率,事半功倍。

今天,我们将通过一个实际案例来展示这个过程,案例内容是利用平台进行工地工人是否佩戴安全帽的图片理解与检测。这张图片是我用来测试的工地场景::

还在为调试提示词头疼?一个案例教你轻松上手!

目标:判断图片中的人是否都佩戴了安全帽。如果没有,就要提醒“操作违规”。第一步,我要写一段提示词来告诉模型我的需求。比如这样:

为了确保安全生产,请根据生产车间的图片,判断是否存在违规操作的设备或未佩戴安全帽的人员,并明确指出具体的违规类型。

这时候,点击生成,右侧就会显示模型的分析结果:

还在为调试提示词头疼?一个案例教你轻松上手!

如果你觉得模型生成的提示词有些地方不对劲,直接选中相关内容,然后点击优化按钮,平台会帮助你修改。像这样:

还在为调试提示词头疼?一个案例教你轻松上手!

然后,你就会看到更新后的提示词:

还在为调试提示词头疼?一个案例教你轻松上手!

这样,提示词就更加清晰,能帮助模型更好地理解任务。最终的提示词如下:

你的任务是根据生产车间的图片,判断是否存在违规操作的设备或未佩戴安全帽的人员,并明确指出具体的违规类型,以确保安全生产。
以下是生产车间的图片信息:
<生产车间图片>
{{image_url}}
</生产车间图片>
在判断时,请考虑以下违规标准:

  1. 存在未按照安全规范操作的设备视为违规操作的设备。
  2. 有人员未佩戴安全帽视为违规行为。

请在<思考>标签中详细分析图片中是否存在违规情况以及你判断的依据。然后在<判断结果>标签中使用“存在违规”或“未发现违规”来给出最终判断。最后,在<违规类型说明>标签中详细说明具体的违规类型,如果未发现违规则写“无”。
<思考>
[在此详细分析图片中是否存在违规情况及判断依据]
</思考>
<判断结果>
[在此给出“存在违规”或“未发现违规”的判断]
</判断结果>
<违规类型说明>
[在此详细说明具体的违规类型]
</违规类型说明>

接下来我们针对某一个case进行测试。

进一步测试:调试和优化

接下来,我们进入调试阶段,看看模型能不能准确判断。比如,我们上传一张工地图片,看看它是否能正确识别工人是否戴了安全帽。

点击prompt调试功能进入视觉理解,因为我们的工地是否带有安全帽都是通过图片抓取的,比如摄像头截图等。

还在为调试提示词头疼?一个案例教你轻松上手!

复制你的提示词后,上传一个图片数据,这里采用url上传,并点击确定,图片从百度搜索一个即可。

还在为调试提示词头疼?一个案例教你轻松上手!

选择最新的豆包模型(Doubao-Seed-1.6-thinking-250715)来生成结果。如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

接下来生成模型回答即可,如果觉得回答有问题,我们可以生成理想回答,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

你也可以生成更多模型回答参考,选择一个你喜欢的,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

如果你觉得回答的都不喜欢,那你就直接提要求,点击下发的优化按钮即可,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

如果你觉得这个测试结果非常优秀,你可以将其直接保存到测试集中。这样一来,我们未来可以利用这个理想的回答来指导大模型的提示词优化,从而确保优化效果的提升。

需要特别注意的是,这个过程仅仅是优化提示词的过程,目的是使得大模型的回答更加符合你所期望的答案,并不是在对大模型本身进行训练。通过这样的方式,我们能够不断完善提示词,提升大模型的输出质量。如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

如果你有很多数据要处理,一个一个手动调试太费劲了。幸运的是,PromptPilot平台支持批量评测功能,可以一次性上传多个数据进行评估。

批量处理

进入页面

首先我们直接进入批量评测功能页面,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

你只需将测试集导入到平台中,系统会自动生成结果。如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

直接上传批量数据集,我已经提前完成了理想回答的优化工作。优化理想回答是一个耗时的过程,需要进行多次调试。完成调试后,我们可以直接让大模型再次生成测试的回答。具体操作如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

评分方式很简单,按照每个模型回答的准确程度打分。比如,如果模型的判断完全符合预期,可以打5分;如果有偏差,就打低分。

还在为调试提示词头疼?一个案例教你轻松上手!

评分完毕后,生成评估标准。如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

我这里生成的有些啰嗦,我们也可以直接修改后使用,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

如果思考标签和判断标签都正确,并且违规类型与理想答案一致,得5分;否则,得1分,尤其是当违规类型与理想答案不匹配时,直接给1分。

还在为调试提示词头疼?一个案例教你轻松上手!

完成优化:不断提升

要对我们的提示词进行智能优化。我们点击进入智能优化页面,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

通过批量评测和优化,最终你会得到一个理想的提示词。平台会根据你输入的“理想回答”来调整提示词,让每次生成的回答都尽量接近你希望的结果。

还在为调试提示词头疼?一个案例教你轻松上手!

在优化的过程中,你也可以实时查看优化过程,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

最后我们直接查看优化报告,如图所示:

还在为调试提示词头疼?一个案例教你轻松上手!

我觉得不好,继续点击优化即可,可以点击这里看下是基于哪个版本进行的优化,如图示:

还在为调试提示词头疼?一个案例教你轻松上手!

当所有的提示词都经过了优化,并且你满意了,就可以保存下来,随时使用。

还在为调试提示词头疼?一个案例教你轻松上手!

至此提示词优化就到这里了。

总结

通过这次的体验,我总结了几点重要的心得:

  1. 清晰的提示词:要让模型理解你想要的输出,提示词的表述要尽量简洁明了,不要含糊其辞。
  2. 反复调试:第一次生成的结果不一定完美,但通过不断的调试和优化,你可以逐渐提高准确度。
  3. 批量评测:当任务量增多时,批量评测功能能帮助你节省大量时间,并快速得到优化结果。

只要掌握了这些技巧,你就能快速从提示词小白成长为高手,充分利用平台的功能,提升提示词优化效率。

  • 本文作者:WAP站长网
  • 本文链接: https://wapzz.net/post-27291.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.7W+
9
1
2
WAP站长官方

高效编解码协议之protobuf协议详解

上一篇

第三人称——骑马系统以及交互动画

下一篇
评论区
内容为空

这一切,似未曾拥有

  • 复制图片
按住ctrl可打开默认菜单