Bart Wronski:我每天是如何使用 ChatGPT 的(从科学家/程序员角度)

本文由Todaylab精选编译,原文链接:How I use ChatGPT daily (scientist/coder perspective) | Bart Wronski

我们都知道互联网是如何运作的——大量的 “热门话题”、两极分化的观点、嘲弄和无知。

最近,每个人都在谈论人工智能,尤其是LLMs/GenAI。在这里,我不会把重点放在 “淘金热 “的影响者、恶劣的骗子、在 ChatGPT 的薄薄包装上建立自己业务的人或天真而贪婪的投资者身上–他们应该受到很多批评,而其他人也是如此。

关于当前人工智能方法可能存在的问题,有许多有效的批评或讨论点–创作者权利和著作权的界限、什么是合理使用、许多职业的潜在失业、当一些工作自动化时 “竞相逐低 “的质量下降、垃圾邮件的进一步自动化、或单一公司控制基本技术和信息。我也不会在这里讨论或争论这些问题;有些问题是有道理的,我也有同感,有些则是误解、情绪化或夸大其词,但这不是本篇文章的主题。

不过,我想谈谈并反驳一些批评,准确地说,是无知的批评。什么叫 “无知的批评”?有人声称LLMs 是毫无用处的 “剽窃机器”、”废话生成器 “或其他类似的东西。这是无知,因为这些人显然没有尝试过使用它们。

这是不对的。有时,这是出于不良意图和单纯的消极态度。有时,这只是因为人们不了解LLMs 适合做什么,以及现在如何使用它。或者,有人曾经以错误的方式尝试使用它,并推断出了一次糟糕的经历。在这里,我将尝试说服第二类人–那些没有玩过 ChatGPT Plus,无法想象其合法用途的人。

我每天都在使用LLMs ,我发现它们是了不起的工具,不仅能提高工作效率,还能让我愉快地使用技术,让我的脸上洋溢着笑容。

如果它们对我有用,就不可能是无用的(除非我的经验并不重要,那就不要看这篇文章了)。而那些带着善意来进行这种对话的人,会问我:”好吧,你用这些东西做什么?”因此,我翻看了上个月的 ChatGPT 历史记录,并将列出其中的一些用途。

首先是一些说明和免责声明

注:我订阅了 ChatGPT Plus。这是完全值得的,如果没有它,下面的大多数应用程序都无法正常运行。如果你对免费版望而却步,那就试试 Plus 试用版吧。我就是其中之一,一位同事说服我试用,我非常感激。

注:如果你想把大型语言模型主要用作知识模型,你会失望的。

注意:在某些情况下,仅仅编写一个查询是不够的。作为 “对话 “效果会更好。

注:我是一个超级基础的人。我不使用任何黑客工具、提示工程,没有任何特别之处。对于我下面介绍的任何用途来说,这都是不必要的。我按照写给同事的方式写说明,只是有时会写得特别精确。

注意:如果你认为某件事/某个人产生了错误就会破坏交易,那么你会失望的。错误时有发生(指出错误后会立即得到修复)。顺便说一句,如果你是这样的人,你如何相信自己或同事?

注:我最近也开始使用 Github Copilot(仅供个人使用,非专业用途),并尝试使用 perplexity.ai 来实现更专业的用途–编码、研究课题,以及真正合法地替代谷歌搜索。不过,我不会在这里介绍这些,因为我没有足够的经验。这两款产品似乎都很有前景!

免责声明和利益冲突披露:这篇文章非常热情,但100%是个人观点。我与 OpenAI 没有任何关系。我只是喜欢他们的产品,并认为每月花 20 美元是最划算的。不过,我确实在研究实时计算机图形学中的机器学习,但更 “传统”–用于压缩或去噪等任务的小型模型。而不是生成式人工智能或语言模型。不过,作为额外的披露–人工智能的成功显然是我的雇主最近市场成功的推动力,所以我可能会有明显的偏见。

注:这篇文章可能会有所改动和编辑。

用例 – 编码和控制台工具

编写 ffmpeg/ImageMagick 命令行

我喜欢(也讨厌!)ffmpeg 的功能–通用、灵活、强大。不过,我从来不擅长使用命令行;比起使用控制台,我更喜欢点击和图形用户界面。上网搜索如何做一些基本的事情,然后 “解决谜题 “和组合不同的选项总是令人沮丧。ImageMagick 也是如此。

ChatGPT 完全解决了我的这些问题。回顾上个月的使用记录,我看到了很多应用,从简单的 “将此 AAC/HEIC 文件转换为 WAV/JPEG”,到 “将此图像水平分割一半并垂直连接”,再到 “从此音频文件中截取 30 秒,从此时间戳开始,以 Instagram 故事的长宽比和分辨率将其放入视频中,并在中间放置此正方形图像 “等高级应用。ChatGPT 会生成一系列必要的操作和命令。

这真是太神奇了。它为我节省了几个小时的时间,帮助我创建了一些我原本懒得做的东西。它还会解释所有的选项和顺序,以便你学习和理解。它很有趣,信息量大,互动性强。

我只记得有一次,它提出的解决方案有一个错误。我向它解释了这个错误的样子,它马上就修复了。

编写小型代码脚本(Python、Javascript)

作为一名研究科学家,我每天都在使用 Python,但像文件系统操作这样的事情可能一个月才会发生一次。我大概检查过数百次 os.walkdir() 的文档。我对 mp3 文件的操作可能一年一次。

现在,我不用再花 15-30 分钟写一个脚本,检查文件夹中的所有 mp3 文件,然后给我列出那些标题为某种格式或包含某个特定单词的文件,重命名它们,并将它们复制到某个文件夹中,我只需询问 ChatGPT,复制它(阅读并验证它是否完成了我想要的操作),运行它,通常就大功告成了。它还会推荐我不知道的库或软件包(比如读取 mp3 元数据)。

去年,我写过一篇关于使用 ChatGPT 为我创建一些 Javascript 代码的博文(我不懂 Javascript)。

我用它编写脚本,下载 Spotify 播放列表的歌曲标题、YouTube 播放列表和 HTML 页面。我过去常常要花费数小时查找和应用正确的库,还经常要学习新的概念。有了LLMs ,这些问题都能一次性自动解决。他们甚至解释了我需要获得哪种开发人员密钥,并为我提供了更高级应用的起点。

对于查找与特定模式匹配的文件等较小的任务,我也懒得使用 “查找 “命令、Windows 查找或 Everything。对于文本,我不会尝试使用编辑器功能。我只需用自然语言向 ChatGPT 询问所需的内容,并生成 Python 代码,然后就能看到 Python 以自然的、人类可读的语法输出。像 sed 和 find 这样的工具是为了输入的简洁性和有限的控制台列而优化的(绝对不是为了可读性),这使得它们在使用一段时间后变得丑陋和难以解读(对我来说,也很难使用)。但当所需的命令行/代码可以为我键入时,它们唯一的优势–简洁性–就消失了,没有什么比 Python 的显式性、可读性和易修改性更好了。

有时会出现 bug,但我读过这些代码;我可以自己修复它们,或者用 ChatGPT 进行迭代。这就是为什么在这一点上,我不想要 “操作系统级自动驾驶”,而更喜欢代码生成和自己执行。

这可以大大节省时间。有些人不费吹灰之力就能粘合批处理命令和脚本,但我不是这样的人。这也不是学习的问题–我一般都知道这些东西,但如果一个月用一次,就会忘记,需要重新学习。而且,顺便说一下,玩 ChatGPT 代码也是一种非常有趣的学习方式,可以让我恢复记忆或发现新东西!这也有点令人兴奋。

编写正则表达式

正则表达式也是如此。我学过正则表达式(学过很多次了,哈哈),我可以用手册或 Regex 101 来解读正则表达式或编写新的正则表达式,但我每两个月才用一次正则表达式,所以每次都需要重新学习。ChatGPT 给了我一个很好的起点。它还会逐步解释正则表达式,所以这既是一次学习机会,也是一次温故知新的机会。

用不同的语言/框架重写代码片段

这是我有点不情愿做的事–因为它进入了 “幻觉 “领域–但我试过几次,还没有失望。我让 ChatGPT 将一段代码从 TensorFlow(我对它不太了解)改写成 PyTorch,结果运行正常。但 ChatGPT 既不是知识库,也不是专门的代码模型,所以我估计它可能会产生幻觉和错误。不过,对于较小的问题,它工作得很好;我没有任何抱怨!而且,它只是一个工具,你可以使用它,也可以不使用它,使用的程度由你决定。

创建 LaTeX 图表

我用 LaTeX 撰写出版物和一些内部文件,如果需要写大量数学公式的话。老实说,我不喜欢它。这是一个过时且令人沮丧的工具。ChatGPT 在这方面可以提供帮助–编写 LaTeX 代码–根据描述甚至原始数据创建表格和图表(粘贴格式不佳的表格数据并要求完整的表格)。它可以帮你调试排版问题并提供建议。

你从中得到的图表可能不仅仅是 “在这里插入 PNG 图像 “的图表,它们还可以是具有 Tikz 程序特色的图表。我完全不懂 Tikz,但在我上一篇论文中,我在 ChatGPT 的帮助下制作了精美的 LaTeX 嵌入式图表。有些论文还在审阅中,所以我没有把结果粘贴在这里,不过我以后可能会粘贴。

在制作过程中,有一件事让我大吃一惊。描述一个图形有时既棘手又毫无意义–如果你试过向同学或同事描述图形,你就会知道没有白板有多困难。一个图形的草图比讨论要好得多。为什么不在 ChatGPT 中也这样做呢?

在谷歌幻灯片或 PowerPoint 中绘制一个粗略的图形,然后将截图粘贴到 ChatGPT 上,并要求它创建 LaTeX 代码,这样做怎么样?是的,这行得通!

虽然不是百分之百准确,经常会出错,但它能成功,真是令人难以置信。它是一种语言和一些视觉模型,能将数字转化为功能代码!如果你遇到错误,可以向 ChatGPT 描述,它通常会纠正错误。要完全按照你的要求绘制一个复杂的图形,可能需要半个小时,但这只是半个小时,而不是浪费很多时间和放弃。

建议:我建议将其分为多个步骤和层次;如果一个图形有两个部分,则分别对其进行迭代。

提示:当您两次描述一个错误,但它都无法纠正或引入了不同的错误时,这时我就会放弃,分解或更改问题。通常情况下,这样就足够了。我没有理由不认为未来更大的模型会解决这个问题。

转换数据并展示数据

与上述类似,ChatGPT 在转换数据(包括格式错误或几乎原始的数据)方面也非常出色。你是否有一个类似于 CVS 的表格,并想用 Python 对其进行处理,以便绘图或提取?或者甚至是科学论文中的原始自然文本?您可以花几分钟时间在您最喜欢的文本编辑器中进行 regex + 替换,处理新行、逗号、特殊情况等。(如果某些行因某种原因不符合要求,还可以迭代)。

或者,把它粘贴到 ChatGPT 上,让它以任何理想的格式重新创建。你甚至可以要求它以你想要的任何格式绘制它–ChatGPT 会编写一个 Python 脚本并执行它!你可以查看它编写和执行的代码,复制它,并自己迭代它。

同样,我们的想法是,它可以协助你,为琐碎的、非创造性的任务提供一个起点,而你则可以专注于有趣的、令人兴奋的部分!

从图像和图表中提取数据

就拿上一点来说–将其与 OCR 功能和输入图像相结合如何?

我可以对文档或网页中的表格或图表进行截图,然后将这些图像粘贴到 ChatGPT 上,并要求它生成 Python 列表、字典或新图表。然后,我就可以对其进行处理、分析或保存,以备将来使用。

我第一次这样做时,它 “就这样工作了”,我又一次被震撼了。而且它还适用于 PDF 等文件。

用例–语言、图像和知识

语法帮助

现在,我们正在进入 “自然语言””语言模型 “的领域,因此它在这方面做得很好–可能对非程序员用户来说更有亲和力。我的母语不是英语–如果你看看我以前的博文,你会发现有很多错误、不自然的语言和遗漏的冠词(波兰语中没有冠词,而是依靠复杂的省略和上下文)。在美国生活后,我几乎只说波兰语(包括在家里),因此我的英语水平有了很大提高;此外,对于较长的形式,我使用 Grammarly(我相信它也有某种语言模型和 ML)。

但我仍然不完美,有时,我需要格外精确和正确,并尽量让自己听起来自然–在关键交流和论文(尤其是摘要)中。

我要求 ChatGPT 不仅要重写,还要强调和解释我的错误。在这个过程中,我学到了很多东西,也加强了我的写作技巧。错误标注和解释非常棒。没有一个说母语的同事能这样帮我(虽然有两个同事向我推荐了《风格要素》)。

缩短和调整段落结构

我使用 ChatGPT 半自动地缩短学术论文摘要,用于自动笔记–我甚至为此写过一篇博文。

但在非自动的情况下,它也非常有用,可以让句子或整个段落更简洁,适用于任何有字数限制的写作,或者仅仅是提高文字的精确度或可读性。我发现它在学术写作(摘要和提案!)以及类似的写作中非常有用,因为在这些写作中,你需要做到绝对明确、尽可能简洁。

帮助把想法变成文字

你可以写几个要点,然后得到一封内容充实的电子邮件、信件或段落。我知道–对某些人来说,这可能是 “离谱 “的,也是笑话的对象。

如果你是斯拉沃伊-齐泽克(Slavoj Zizek)的粉丝,你可能会看到一个备忘录,其中他关于……我们姑且称之为 “关系 “的原创笑话和声明……被转述为 “一个学生用他们的 ChatGPT 写了一篇论文,我用我的 ChatGPT 给它评分,我们的上级和学术督导都很满意,真正的教学和学习终于可以开始了!”。

这显然是个笑话,一个人只用两三个要点就写出了不必要的长篇邮件,而另一个人却把它总结成了要点,这让一些人很不高兴。我不知道他们是否注意到,我们生活在一个社会中,生活在人与人之间,所有的交流都是经过编纂的,传达的不仅仅是原始的思想。你不可能在没有任何形式或结构的情况下向政府机构发送两个要点。

但我想说的是!我用它来处理一些情况,否则无论如何我都不得不依赖模板。如果您与美国移民打过交道(无论是作为来自许多签证国家的游客、技术工人、寻求移民签证/永久居留权的人,还是帮助他人获得这些签证/永久居留权的人–我都做过这些事!),您可能会要求(或撰写)签证或入学推荐信。这些推荐信既愚蠢又公式化,要么是由律师撰写的(如果有人雇佣律师的话),要么是从网上的模板上复制的。我甚至遇到过这样的情况,有人告诉我:”这是我的签名扫描件,你自己写封信用吧。我不在乎”。这让我很不舒服,因为使用别人的签名,即使征得了他们的同意,也会让人觉得是在欺诈……这也表明了这个人并不关心我,但不管怎样。

因此,ChatGPT 在处理此类文件和其他官方文件时非常省时。我只需花 10 分钟列出为什么某人应该获得签证或绿卡(因为我了解他们和他们的成就,而且我关心他们),然后人工智能助理就会根据这个公式化的模板为我撰写信函。我稍作修改,确定这是我的信,然后我们就大功告成了。双赢。

我在与不熟悉的人交流时也用过几次,比如,我想提醒他们答应过我什么。我有轻微的自闭症(早期被诊断为阿斯伯格综合症),难以读懂别人,也无法根据情况和背景调整自己的交流方式。这种情况加上偶尔的不安全感和焦虑,意味着我有时会花上一个小时来纠结和强调一封三行的电子邮件。我的语气正确吗?这听起来是消极攻击吗?会不会太不自信?是否不够正式?是否过于正式?LLM 助手可以在 30 秒内为我写出这样一封邮件。

(不,这篇博文不是用人工智能助手写的。😅只是Grammarly。我其实很喜欢写作和写博客。但发送电子邮件……这得看情况)。

这适用于更多非个人的情况和互动。”只要学好语言,写好文章,并付出努力 “是一个低劣且具有排斥性的建议,尤其是针对移民和非母语人士。

题外话和轶事:我记得我在谷歌时,每个人每年都要花两周时间写狗屁同行评语(管理人员至少要多花两倍时间)。没有人写诚实的评论。在我的第一个审核周期,我诚实地写了几份同行评语–积极的、表扬同事的,但也强调了需要改进的地方。我想,我可以帮助他们成长,不是吗?我被我的经理训斥了一顿,他非常生气,告诉我永远不要写任何批评别人的东西,哪怕是轻微的批评。我不知道现在有多少 Googlers 用LLMs 来写那些狗屁评论。

总结文章

我只用过几次这个选项,并把它作为一个起点。我一般都很喜欢阅读,让 ChatGPT 对每篇文章进行总结听起来像是但丁的地狱圈中的一种折磨方式。但有时,文章词藻华丽、枯燥乏味,或者写得让人不过瘾(就像一个无聊的记者对一个讨厌的人进行的没有重点的采访)。而我需要一些这样的信息来了解最新的信息。晚期资本主义的广告经济也助长了大量文章,这些文章只在一个段落中包含新信息,其余的都是为了展示蹩脚广告的填充物。这浪费了人们的生命和时间。

我曾多次使用 ChatGPT,要求它总结一篇文章的 PDF 打印件,列出文章的主要观点。它可以列出要点,总结某人提出的论点,我甚至还可以要求它列出可能的反驳论点,或者告诉我如何进一步了解某个话题/问题。

另外,它还可以帮助你阅读专家撰写的长达 30 页的文章。你可能没有足够的背景去阅读它,对这个主题感兴趣,但又不那么感兴趣。只需让LLM 对其进行总结即可。

总结 YouTube 视频

第一次尝试时,我超级兴奋。资本主义后期的广告经济和时间浪费问题在 YouTube 视频中更为严重,再加上信息很难查找和浏览,不是吗?

虽然 ChatGPT 无法直接总结 YouTube 视频,但有一些免费服务可以转录或让你下载 YouTube 视频的自动转录/字幕。然后,你就会看到一堵文字墙、许多 “嗯 “和 “我们赞助商的话”。你可能不想读这些东西。因此,只需将其保存并上传到文档中,然后使用 ChatGPT 以要点形式总结 YouTube 视频副本即可。

我用过几次,主要是针对我已经看过的视频,其中包含技术性很强的技巧,例如在我最喜欢的 VST 音频合成器中操作波形的技巧。我可以手动写下所有内容,潦草地浏览视频、暂停、alt-tabbing,这样会浪费我一个小时的时间。有了 ChatGPT,我只需花 5 分钟就能弄明白如何转录视频,然后再花 5 分钟按自己的喜好编辑笔记。

你也可以对任何充满填充物的视频做同样的处理,尽管只有一分钟的实际内容,却可以延长到 10 分钟来赚钱。不要让别人不尊重你,浪费你的时间;这是你永远无法收回的最宝贵的资源。如果你关心内容创作者的经济状况,所有值得关注的人都会告诉你,他们几乎不靠广告赚钱,你可以通过 Patreon 或购买他们制作的东西来支持他们。(我是这样做的,希望你也能这样做!)。

解释学习中的错误

你可以用 ChatGPT 来解释自己的错误或 bug!我听说有人成功地解决了代码错误(有人提到它在他们的代码中发现了一个多线程错误),但我用它做了一件简单得多的事–学习西班牙语。

我使用 Duolingo(虽然它不能教我说西班牙语,也不能让我很好地表达思想,但它让我对书面西班牙语的理解达到了阅读报纸的水平),但它一般不解释语法,尤其是在更高级的水平上。每当我困惑于 “为什么它说我的答案是错的?”时,我就会用手机截图,然后粘贴到 ChatGPT 上,然后就会得到关于我的错误和语法概念的非常好、非常全面的解释!

我不需要输入任何内容或复制粘贴,这在手机上很烦人;我只需将应用程序截图作为图片粘贴即可。

小型翻译

既然我提到了学习语言,我就用它做过几次小翻译。从我有限的经验来看,它的跨文化翻译和表达方式比 Google 翻译要好得多。因此,翻译不会字字忠实,但会更符合目标语言母语使用者的期望和习惯用语。它更 “自然”。我还可以通过提示说明进一步控制这种文化适应与忠实。

私人教师

ChatGPT 可以成为你的私人教师/导师/辅导员,教你常见的话题(或半专业的,但我不相信小众的话题)。我曾几次这样使用它,效果非常好–让 ChatGPT 就你正在尝试学习的一些主题向你(!)提出难度逐渐增加的问题,并对你的答案进行评分。

回答这些问题,让它给你的答案打分,并告诉你可以在哪些地方进行扩展,或者你理解错了什么。然后继续对话。不要做任何提示工程魔法,就像与老师交谈一样(你不需要对老师客气)。

在一个你觉得有点熟悉的新领域试一试。让它用一种新的语言进行角色扮演。或者让你解决一些简单的数学问题,然后对解决方案进行评分。

如果你想学的题目不是非常奇特,而且你有一定的基础,那么它绝对是非常出色和吸引人的。我在上面花了好几个小时。上一次我在新技术上获得如此多的乐趣和参与感,还是在我十几岁时发现维基百科,并花了好几天时间跟着链接学习的时候。

它会产生错误答案的幻觉吗?当然会,尤其是在小众话题上。但即使是非常昂贵和合格的私人教师也会这样。我认为,每个人都曾遇到过对某些事情无知(却又自信)的好老师。而且–根据我的经验–幻觉的说法被夸大了。我经常会告诉你 “我不知道”。网上很多发现错误的例子都是来自非 Plus 的普通版本,或者来自很久以前的旧机型。

生成图像 – 我的音乐

在工作和计算机制图之外,我最大的爱好就是制作音乐–声音设计、音乐制作、作曲、编曲,最近还做了 DJ。在这方面我不使用任何人工智能(好吧,我算是间接地使用了!我很惊讶地看到 Rekordbox 复制了数十个 Tensorflow DLL 用于音干分离,许多 VST 也开始使用 ML 模型)。不过,最近为了好玩,我还是添加了 DALL-E 生成的图片作为虚拟 “单曲 “封面。这是世界上最好的艺术吗?不是,它很廉价、老土。但它很有趣;当我在制作过程中这样做时,它可以引导我对氛围和气氛产生新的想法,并将我 “固定 “在一个特定的方向上(而不是布朗行走)。

Bart Wronski:我每天是如何使用 ChatGPT 的(从科学家/程序员角度)
concatenated_image.jpeg

最近,我完成了四首曲子,有两个人独立告诉我:”我都喜欢,但这首是我的最爱,可能是因为’封面’。

我是在取代插图画家的工作吗?不。早些时候,我根本不会这么做。如果这本书要发行的话(而不仅仅是我不断投入资金的爱好),唱片公司会聘请真正的艺术家和设计师。

生成图像 – 情境板和参考资料

与视频游戏工作室的美工一起工作时,我总是对他们的 “参考资料 “文件夹着迷。他们有数百万兆字节的(未经许可的)下载图片,他们会用这些图片来获得灵感,并配合特定的主题,比如在制作某些特定的资产或关卡时。然后,他们会创建 “情绪板”(有时会与艺术总监合作)–松散的联想和图片集合,作为形状、颜色、图案和主题的灵感来源。

(注:有时,这种随意下载图片和 “灵感过剩 “的做法会给他们带来麻烦。你可能听说过 “电子游戏工作室从其他艺术家的作品中窃取东西 “这样的案例。但这并不是真正的 “邪恶的大工作室与小创作者的对决”,而只是工作室的某个艺术家(通常是初级艺术家)马虎懒惰,忘记了他们从哪里得到了一些参考图片,也懒得去检查。管理链上也没有人去检查)。

除了摄影,我没有任何视觉艺术方面的背景或经验,也不会画直线,所以我发现与 ChatGPT 一起制作 “情绪板 “对视觉创意非常有用。我在 “心情板 “中使用人工智能生成的图像来设计纹身创意(这样就可以更容易地与艺术家沟通–反正他们也会自己进行适当的设计),与我的妻子一起设计我们想要装饰的房间,或者如我提到的,用于音乐等其他创意工作。

Bart Wronski:我每天是如何使用 ChatGPT 的(从科学家/程序员角度)
calendar.jpeg

我妻子花了一个圣诞周的时间,用 Adobe Express 和各种 AI 图像生成器为我们制作了一个装饰艺术/新艺术卡通纽约市主题日历,供我们个人使用,我很喜欢这个结果。

集思广益–标题、主题

我不擅长给事物命名(只要看看我的出版物的标题就知道了;它们是世界上描述性最强、最没有创意的)。我的母语不是英语,很容易使用不自然的语言结构和其他语言的陈词滥调,所以我更愿意 “保持安全”。

但我可以使用LLMs 来帮助我获得更有趣的命名。ChatGPT 可以给我提供十个可能的标题,我可以选择并修改其中一个(或者完全忽略它们,但仍然有一个新的想法,即我想要的方向!)。

同样,它还能快速随机生成某个主题的创意(在 ChatGPT 的帮助下,我们和我妻子一起为纽约市主题日历集思广益)。这是否意味着我放弃了我的代理权和创造力?不,远非如此!

这类似于制作生成音乐(可以是完全随机的,也可以是程序化的)。你会产生许多随机的想法,然后挑选一个能引起你共鸣的想法作为起点,并在此基础上进行手动迭代。在选择和迭代的过程中,你的创造力和主观能动性依然会表现出来。即使是最有创造力的人,也会使用这些技巧来解决创意障碍并催生新项目(只要阅读任何一本关于创意音乐创作或制作的课程书籍,你就会发现类似的建议)。

知识库 – 这里有龙

这本是极少数情况下才应该做的事(跟我说–“语言模型不是知识模型!”),但不幸的是,谷歌搜索在过去的两年里变成了垃圾。谷歌搜索的结果主要来自 Quora(使用广告拦截器后几乎无法使用,而且充满了 100% 的错误答案)、(错误)信息框、广告和搜索引擎优化垃圾邮件。

这成了一场灾难。对于许多热门话题,除了 “搜索词 reddit “之外,在谷歌上根本不可能找到任何真正的信息(不是某种形式的广告或与商业相关的信息)。否则,第一页不是广告就是搜索引擎优化的垃圾。如果谷歌不解决这个问题,他们也许只有一年的时间,直到人们永远离开(当质量下降时,A/B 测试–企业喜欢这种测试,因为它们给了他们一种数据驱动和 “客观 “的错觉–不会立即显示出来,就像慢慢煮熟的青蛙。而我觉得比喻的青蛙已经被煮熟了)。

在某些场合,我向 ChatGPT 提出了一些技术性问题,并得到了可靠的答案–但我把它们当成了潜在的幻觉。但从这些问题中,我知道该去哪里寻找更多答案,而且也没有失望。

为此,我开始使用 perplexity.ai,到目前为止,它非常非常有前途!简洁、精确、有参考链接。如果它不知道答案,也不会产生幻觉,而是会说:”回答这个问题的资源并不多”。缺点是,它根据人们在网上粘贴的内容生成答案,这并不可靠。

小贴士:LLMs 的一个有趣、合法且风险不大的用途就是问一些松散的问题、联想和你对流行文化不确定的事情。它可以回答 “90 年代那首duududu du du du du的歌是什么?”,但即使不能回答,也是无害且有趣的。

结论–我的看法和未来

从上文可以看出,我通常不会将LLMs 用作搜索替代品或知识模型。

我不会用它们来 “从头到尾 “完成任务,也不会让我的生活自动化。

我不依赖 Gen AI 来取代我的创造力。

我以互动的方式使用它们,我的决策和注意力始终都在这个过程中。

LLMs 别让我成为 “100 倍程序员 “什么的。

那些认为他们会用LLMs 和自动化取代员工的首席执行官和人工智能影响者都是白痴。

但是LLMs 这绝对是件令人愉快的事,给我带来了很多欢乐。

他们让我参与其中,并对他们所做的一切感兴趣–这不是我的替代品,不是自动化,而是一个有趣的助手,帮助我学习和进步。

至少十年来,我从未在使用任何技术时感受到如此多的快乐和敬畏。

虚拟现实?不舒服,恶心。AR?试图让自己始终体现在工作、通知和广告中。加密货币?无用、为犯罪服务、充满欺诈。网络3?纯粹的小资本主义骗局,将我们的整个生活商品化。过去十年中,有大量极其乏善可陈、被过度夸大的技术。

但至少在我看来,人工智能才是真正的下一件大事(或者说是当前的大事)。在这里,我的重点是LLMs ,我甚至没有触及表面,因为 ML 已经给计算机图形学和计算机视觉等领域带来了革命性的变化。对于LLMs 和 Gen AI,我认为这与商业或生产力无关。我不在乎!重要的是我能从中获得很多乐趣;它既能为我服务,又能让我玩得开心和愉快。是的,这一点超级重要–技术应该是有趣的、好玩的、令人愉悦的。我想拥有 90 年代中期的感觉,那时我才 7 岁,刚刚接触 DOS 和 Windows 3.11,开始用 Turbo Pascal 编程,然后第一次接触 Web 1.0,并创建了第一个 “无用 “的 HTML 主页。我们并没有沦为生产力和我们能为资本带来的价值。同时,这也是我认为应该推进开源LLMs 的原因,世界上的每个人都应该获得平等的访问权(最好是在自己的本地设备上,不受任何公司的控制)。

虽然在技术和社会方面存在一些合理的担忧和批评,但我仍然保持乐观。这些问题似乎都可以解决,而且完全值得一试。LLMs ,但即使它们不会有太大的发展,我也能接受现在的它们,因为它们已经让我的生活变得更美好了。我希望这篇文章能告诉你如何去做,也许还能鼓励你以新的方式去享受它们带来的乐趣。

AI工具箱

比尔·盖茨对话 OpenAI CEO 奥特曼:AI将带领人类进入「没有稀缺」的世界

2024-1-13 9:52:00

今日译读

行动孕育新知:如何做出更明智的决策

2024-2-10 10:42:49

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
搜索