澎湃Logo
下载客户端

登录

  • +1

新手视角打开ChatGPT+Mermaid实现数据可视化

2023-08-01 18:01
来源:澎湃新闻·澎湃号·湃客
字号

原创 数据火锅 数据火锅

2022年11月30日,美国公司OpenAI开发了一款由人工智能技术驱动的实用工具,它可以通过自然语言处理(Natural Language Processing)根据问题为用户提供的各种个性化的解答。这个聊天机器人的全称是“Chat Generative Pre-trained Transformer”,也就是我们常说的“ChatGPT”。而ChatGPT-3.5,则是OpenAI突破性对话式人工智能的进阶版本,该版本在前一版本的基础上取得了显著进步,重新定义了人类智能与人工智能的交互方式。

本文将简单介绍ChatGPT-3.5,从一个没有编程基础和计算机相关知识储备的新手角度,向大家详细展示该如何有效运用ChatGPT-3.5处理数据,并实现数据的可视化。

一、如何使用ChatGPT-3.5实现数据可视化

由于ChatGPT-3.5暂时不具备直接生成图像的功能,当提出相关指令时,它会生成应用代码,并推荐相关辅助工具进行呈现。如图;

本文选用适合新手使用的辅助工具Mermaid为例,了解用户该如何使用ChatGPT-3.5处理和展示数据。

1. 辅助工具介绍

Mermaid(https://mermaid.js.org/)是一个轻量级的文本驱动的图表生成工具,它可以通过简单的文本描述来创建各种类型的图表,包括流程图、序列图、甘特图、类图等。Mermaid图表可以嵌入到网页、Markdown文件或其他支持Mermaid的环境中,并且无需使用图形界面工具即可快速创建图表。

主要特点和优势:

(1)简单易用:Mermaid采用直观的文本描述语法,使得创建图表变得简单易懂,无需复杂的代码或图形设计技能。

(2)多种图表类型:Mermaid支持多种图表类型,包括流程图、序列图、甘特图、类图、饼图等,适合不同的应用场景。

(3)跨平台支持:Mermaid图表可以嵌入到网页、Markdown文件、Confluence和其他支持Mermaid的环境中,支持跨平台使用。

考虑到零基础用户缺乏编程等相关知识,我们选用的Mermaid使用门槛低,更适合新手使用。

2. 如何利用ChatGPT-3.5生成可视化图表 —— 以饼图为例

首先,我们需要向ChatGPT-3.5 提供你想要进行可视化的数据,此处我们选用一篇英文文献作为原始数据。

案例1:使用ChatGPT在英文文献中提取数据信息并制作恰当的数据可视化图表

首先,在打开与ChatGPT的聊天框后,我们上传一篇英文文献Jane Jackson (2015) Preparing students for the global workplace: the impact of a semester abroad, Language and Intercultural Communication中关于参与者实验的部分,要求它提炼上传内容的数据,并将数据内容翻译成中文。

如上图所示,ChatGPT已经提炼并翻译了数据,经过核查,数据的翻译与提取无误。

接下来,我们再次截取关于参与者国别数据的部分,并询问ChatGPT这组数据适合用什么种类的图表来进行数据可视化。ChatGPT为我们提供了两种方案,分别是饼图和柱状图,并解释了两种图表本身的适用范围,以及在本组数据中所能展现的侧重点,以便我们能根据需求来选择其中一种。

最终,我们选择了饼图。但当我们要求ChatGPT直接用数据生成可视化图表时,它表示自己作为文本模型,无法直接在这个环境中创建交互式图表,并给出了一段用Python语言呈现的代码。由于不具备Python代码运行的相关环境,我们最后选择了Mermaid辅助工具,方便在线生成图表。于是我们换了一种提问方式,要求ChatGPT使用Mermaid语言为这组数据做一份饼图。

(请注意,在使用Mermaind生成图表之前,确保你的编辑器或网页支持 Mermaid的语法和渲染)

我们复制了ChatGPT输出的代码,投入到Mermaid网站中使用,顺利得到了饼图。

到此处,饼图图表的制作成果已经出来了。

值得注意到是,在进一步探索ChatGPT-3.5的过程中,我们发现并不是所有的指令ChatGPT-3.5都可以实行。以下通过展示小组在试用ChatGPT出现的错误案例,展示ChatGPT-3.5 在运行中可能会出现的反复修改手法,有“迎合胡说”等问题。

当我们尝试询问ChatGPT,要求其生成一段规定饼图各部分颜色的代码,使饼图变得更美观时,ChatGPT向我们提供了一段代码。根据新生成的代码,我们再次回到Mermaid尝试。尽管饼图整体的颜色明度变小,看起来更和谐,但并没有达到我们的预期,且Mermaid页面跳出error字样,显示错误。

此时,我们假设错误的原因可能是由于ChatGPT没有正确理解我们的需求,我们返回ChatGPT,向它进一步明确我们的要求,提出用Mermaid代码将饼图颜色调整为同一颜色的不同色调,ChatGPT根据要求调整了代码的写法。

但代码运行再次显示错误,饼图的颜色与前一调整颜色代码的结果完全一致。我们追问ChatGPT如何修改显示错误的代码,它改变了说法,表示Mermaid无法实现渐变色效果,建议我们使用其他的数据可视化工具并做了推荐。同时它再次推荐如果不需要渐变色效果,可以把颜色调整一致,但其代码形式与前文一致,Mermaid运行仍然显示错误。

我们再次询问以确认Mermaid到底是否能实现颜色的调整,它提出了一个新的代码形式,尝试后证实错误。经过4次问答与3次代码形式修改,我们最终确认Mermaid无法实现颜色修改。同时得出结论,ChatGPT存在反复修改手法,有“迎合胡说”等缺点,在离真正高效、准确实现从文献中提取数据,并完成可视化图表或者给出代码在插件以及辅助工具中实现数据可视化功能上,存在很大的进步空间。

3. 如何利用ChatGPT-3.5生成可视化图票 —— 以甘特图为例

案例二:使用ChatGPT3.5帮我画一个备考全国二级计算机考试的甘特图。

首先,提问“备考中国的全国二级计算机考试一般需要多久?”

回答是:“备考中国的全国二级计算机考试所需的时间因个人情况而异,但一般来说,考试前的备考时间可以在数周至数个月之间。以下是一些建议的备考时间分配......”

这个回答没有给出具体数据,并且答案将重点转移到了备考时间分配上。由此,我们可以推测ChatGPT3.5的信息库中并没有相关知识。

人为限定了备考时间,继续提问:“你可以用Mermaid.is帮我做一个月备考中国的全国二级计算机考试的甘特图吗?”它的回答是首先道歉作为一个 Al 语言模型,无法直接与外部网站或工具(如 Mermaidis)交互来创建甘特图。然后提供了一个基本甘特图的文字表述。由此,我们可以发现ChatGPT 3.5的弊端:不能安装插件,只能提供文字代码,需要人为复制到其他平台上运行,生成图片。

看ChatGPT生成的文本:“第一部分是基础知识学习:专业知识学习、综合练习、模拟考试。第二部分是复习与准备:复习基础知识、复习专业知识、模拟考试。第三部分是考试:考前冲刺、考试日。”给出的复习步骤及其笼统,没有针对全国二级计算机考试提出建议。我认为它并不知晓这方面知识,于是在网络上找到了他人分享的经验。

将文字版的经验分享发送给ChatGPT,此时ChatGPT可以自动进行文本总结,列为五点。

此时ChatGPT-3.5 已经接受了相关数据信息,使用者就可以提出使用需求了,如“根据上述备考经验,你可以用Mermaid.is帮我做一个月备考中国的全国二级计算机考试的甘特图吗?”这次ChatGPT的回答更加具体,有针对性。它提取出了文本中的学习计划分为三个阶段:“前期计划”(早期阶段)、“中期计划”(中期阶段)和“后期计划”(后期阶段)。并且也有:“观看基础视频、动手操作软件、基础操作练习、刷题库专项练习、刷真题”这样更具体的学习方式。

此时我们再次复核ChatGPT-3.5给出的答案和提出的要求。可以发现,它提取文本信息的时候只关注到复习时间约一个月,而忽视了考试时间为9月23日至9月25日。

于是,使用者需要提出更加明确的任务需求:“根据上述备考经验,你可以用Mermaid.is帮我做备考中国的全国二级计算机考试的甘特图吗,考试日期为9月23日至9月25日。”

最终才生成了一个达到我们要求的甘特图。

二、使用体验总结

在使用ChatGPT 3.5的过程中,可以感受到其整理分析总结文本的强大能力,但对于使用其进行数据可视化仍然是一个费劲的工作。ChatGPT 3.5仍然具有很大的局限性。由于ChatGPT 3.5无法安装插件,需要将其生成的代码放到其他平台上进行图片生成,并且其将文本信息转换成可视化图像中信息的能力较弱。

除本文小组在实操中发现的问题以外,为使信息更加全面,我们也收集了网络平台上的一些用户反馈。总体来讲,ChatGPT-3.5 作为目前前沿人工智能大语言模型,可以基本满足非专业数据处理者的日常需求。

示例1:知乎热门评论截图

而根据OpenAI 公司的评估,ChatGPT-3.5也具备较强的数字处理能力。通过模拟真实考试的条件和评分细则,OpenAI评估了ChatGPT在学术和专业考试中的表现。实例证明,ChatGPT在数据处理水平的专业水平较高,足以支撑基础的数据处理。

示例2:Open AI 官网论文截图

但同时,ChatGPT-3.5 的问题也不容忽视,要求用户批判性思维能力和具备向AI准确提供指令的能力。在收集用户评价的过程中,我们发现不少用户均反映ChatGPT-3.5 无法处理较高水准的数据处理任务,但会出现ChatGPT-3.5提供不准确的处理结果迷惑用户的情况。一篇发表在Axiv上,研究ChatGPT-3.5与ChatGPT-4.0论文表示,“研究发现,对于简单的算术、代数表达式或基本逻辑谜题,聊天机器人可以提供准确的解决方案,尽管不是每次尝试都能成功。但是,对于更复杂的数学问题或高级逻辑任务,虽然它们的答案通常写得 ‘令人信服’,但可能并不可靠。” (It has been found that for straightforward arithmetic, algebraic expressions, or basic logic puzzles, chatbots may provide accurate solutions, although not in every attempt. However, for more complex mathematical problems or advanced logic tasks, their answers, although written in a usually "convincing" way, may not be reliable. )

示例3:Twitter 热门评论截图

不仅如此,ChatGPT-3.5 在进行指令分析时,存在无法准确理解指令的情况。此时要求使用者进一步精确指令,并仔细检查生成结果是否存在忽略重要初使条件的条件的情况。此时建议使用者明确指令的基础条件和需求。

示例4:微博热门评论截图

三、ChatGPT-3.5 的背景介绍

ChatGPT-3.5的基础信息

ChatGPT-3.5是人工智能技术驱动的自然语言处理工具。这个模型基于 Transformer 架构编写而成,它以其强大的理解文本能力和生成各种邮件、视频脚本、文案、翻译、代码的能力而闻名。OpenAI通过它用大量数据进行广泛的预训练,并让它进行强化学习然后微调,ChatGPT-3.5 已成为一个强大的对话伙伴,在从数据处理到协助创意写作等一系列任务中表现出色。

独特功能与进步:

(1)坚实的数据基础: ChatGPT-3.5 拥有大量参数,在此基础上,该模型可以更深入地理解语境,从而做出更准确、更符合语境的回复。

(2)多模态输入: 除了纯文本,ChatGPT-3.5还善于处理多模态输入,如图像和语音数据。这一功能可以更全面地理解用户的询问,打造更身临其境、更自然的对话体验。

(3)语境敏感性: ChatGPT-3.5具有出色的语境感知能力,能在扩展对话中保持连贯性。它能把握细微差别并回想之前的互动,创造出流畅逼真的对话,与用户产生共鸣。

(4)零点学习能力: ChatGPT-3.5 展示了令人印象深刻的适应性,因为它可以从少数几个示例中学习(少量学习),也可以执行未经明确训练的任务(零点学习)。这一功能简化了人工智能培训,使用户能够更高效地实现目标。

(5)进阶的响应能力: 在实时应用领域,响应速度至关重要。ChatGPT-3.5 提供了快速的响应时间,使交互感觉无缝、动态,模糊了与人工智能和人类对话之间的界限。

四、 总结

总体上来说,新手小白可以借助ChatGPT3.5完成基础的数据可视化的代码书写,本文以饼图与甘特图为例展示了无编程基础的使用者该如何利用ChatGPT-3.5实现数据可视化。同时,本文也通过展示出使用过程中的障碍,表明了ChatGPT-3.5的功能缺陷。在使用过程中,我们建议使用者尽量详细写明自己的需求,并在使用过程中不断复核与检查,以保证数据的准确性。

北京大学暑期课《数据新闻》作业

图文|你说的都对组

组员|尹伊茗 吴茜文 党一 温馨 叶珂妤 王嘉璐

原标题:《工具 | 新手视角打开Chat GPT+Mermaid实现数据可视化》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈