利用 50 行 Python 代码构建一个在线文本生成器! |
您所在的位置:网站首页 › python生成文本指令 › 利用 50 行 Python 代码构建一个在线文本生成器! |
本指南将引导你学习构建一个自动完成任意输入文本的Web应用程序。 以下为译文: 在本文中,我们将使用OpenAI的新一代表语言模型GPT-2来建立模型,使用Panel框架来构建web页面的仪表板。本指南分为两部分。在第一部分中,我们将加载我们的模型并编写一个预测函数。在第二部分中,我们将构建一个web应用程序。 自动生成文本的应用程序示例。我们将构建这个web应用程序的一个更简单的变体。对于我们的web应用程序,我们将利用Panel这个窗口容器/框架,这是一个很好的工具,可以被用来从jupyter notebooks或者常规的Python脚本中轻松地创建可维护的仪表板。可以使用以下命令安装Panel: pip install panel接下来,我们将加载OpenGPT2的Tokenizer和语言模型:(如果是第一次运行,可能需要几分钟下载预先训练的模型) tok = GPT2Tokenizer.from_pretrained("gpt2") model = GPT2LMHeadModel.from_pretrained("gpt2")预测函数 在这个阶段,大部分工作已经完成了。因为我们的模型是预先训练过的,所以我们不需要再次训练它或做任何修改。我们只需要编写一个函数,它可以向模型输入文本并生成预测的文本。 def get_pred(text, model, tok, p=0.7): input_ids = torch.tensor(tok.encode(text)).unsqueeze(0) logits = model(input_ids)[0][:, -1] probs = F.softmax(logits, dim=-1).squeeze() idxs = torch.argsort(probs, descending=True) res, cumsum = [], 0. for idx in idxs: res.append(idx) cumsum += probs[idx] if cumsum > p: pred_idx = idxs.new_tensor([choice(res)]) break pred = tok.convert_ids_to_tokens(int(pred_idx)) return tok.convert_tokens_to_string(pred)这个函数中发生了很多事情。因此,让我们把它分解来看看。首先,我们对input_ids中的输入文本进行标记(tokenize)和编码(encode)。接着,我们要求我们的模型为下一个单词/标记(token)生成一个logits向量。在应用softmax函数并按降序对这些可能的概率结果进行排序之后,我们得到了一个向量idxs,它按各自的概率顺序列出了每个token的索引。 在这个阶段,我们可以选择概率最高的token。但是,我们希望能够混合结果,以便相同的输入文本可以生成各种文本。为此,我们将添加一个随机元素,从最可能的下一个token列表中选择一个随机token。这样的话,我们就不会每次都选择相同的预测token。为了做到这一点,我们采用了Nucleus (Top-p) Sampling 方式。 我们通过循环遍历每个概率来执行此操作,直到循环遍历的所有概率之和大于p(这里的p是一个介于0到1之间的任意数字)。当p被超过前,所有遍历到的token都将被存储在列表res中。一旦p被超过,我们就从这个列表中随机选择一个token。请记住,我们正在遍历的概率列表包含了其按概率排序的索引。注意,p值越高,我们的列表中将包含更多的token。反之亦然。因此,如果每次都希望得到相同的结果,可以将p值设置为0。 现在,让我们测试一下我们的预测函数:Panel:可以包含一个或多个窗格(pane)对象的容器,面板(pane)对象是指文本、图像、图形、小部件等(也可以包含其他panel); Pane:任何单个对象,例如文本、图像、数据帧等; Widget(小部件):用户可以自行调整的项目,包括文本输入框、滑块、按钮、复选框,等等可以改变窗格的行为的小部件。 下一个也是最后一个你需要知道的事情是:我们有多种方法来定义不同的窗格和小部件之间的交互方式,我们称之为“callback(回调)”。例如,如果按下某个按钮,其他窗格应该如何更新呢?稍后我们将定义一个回调函数来演示它将如何准确地做到这一点。 Web应用程序简介 我们的文本生成器应用程序将有一个输入窗口,以便用户输入他们想要输入的文本。接下来,用户应该能够通过按下按钮生成新的token。在这之后,它将使用我们在第一部分中定义的预测函数来预测新的token来生成新文本。最后,用户应该能够在已经预测的token基础之上继续生成新的文本。 实施 让我们首先导入Panel并创建文本输入小部件: import panel as pn pn.extension() # loading panel's extension for jupyter compatibility text_input = pn.widgets.TextInput()现在,如果在jupyter中执行文本输入,我们将得到以下结果: 注意,这里我们将文本对象设置为text_input的值。我们希望generated_text的值与text_input的值相同,因为我们将要在generated_text之上预测新文本。随着越来越多的token被添加到我们的序列中,我们将继续基于generated_text进行预测,直到用户改变了text_input。一旦用户改变了text_input,这个进程将重新启动。 然而,到这里事情还没有完全结束。尽管generated_text将在开始时接受text_input的值,但如果text_input值发生更改,generated_text值将不会自我更新。为此,我们需要像下面这样将这两个对象链接在一起: text_input.link(generated_text, value='object')这里,我们在text_input和generated_text之间形成了单向链接。因此,每当text_input的值发生更改时,generated_text值也将更改为新值。如下所示: 很好,现在我们有了一个按钮,我们只需要把它和我们想要的行为链接起来。为此,我们将编写一个回调函数,该函数将在每次单击按钮时运行: def click_cb(event): pred = get_pred(generated_text.object, model, tok) generated_text.object += pred 这里发生了两件事。首先,我们将generated_text作为输入传递给我们之前编写的预测函数,该函数将生成一个新的token。其次,将此token添加到generated_text中。每次新单击按钮时,这个过程都会重复。 到这里,我们仍然需要将按钮单击事件与回调函数绑定在一起。我们可以这样做: button.on_click(click_cb)我们现在已经完成了所有小部件、窗格和函数的创建。接下来我们需要做的只是把这些东西放在一个面板里,然后看看会发现什么: app = pn.Column(text_input, button, generated_text); app只要你的笔记本中有以下代码,这个操作将在本地端口上启动你的web应用: final_app.servable()大功告成! 现在,你自己有能力构建一个自动生成文本的应用程序。你可以通过添加更多panel组件来进一步完善它。你甚至可以将此应用程序嵌入到其他项目中。像往常一样,你可以在github上找到我的代码库。注意:下面图片中的app是我在本教程中使用的app(text_generation_app.ipynb)的高级变体:。 原文:https://towardsdatascience.com/build-a-text-generator-web-app-in-under-50-lines-of-python-9b63d47edabb 本文为 CSDN 翻译,转载请注明来源出处。 【End】热门:Python 学习 100 天 https://edu.csdn.net/topic/python115?utm_source=csdn_bw 热 文 推 荐 ☞ |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |