【论文浅尝】Large Language Models for Generative Information Extraction: A Survey

本文对生成式IE的LLM进行了全面的探索。使用两种分类法对现有的代表性方法进行分类:

(1)众多IE子任务的分类法,旨在对可以使用llm单独或统一提取的不同类型的信息进行分类;

(2)学习范式分类法,对利用llm生成IE的各种新方法进行分类。

Preliminaries of Generative IE

这种生成式IE调查主要涵盖了NERREEE的任务。这三种类型的IE任务以生成方式制定。给定一个输入文本其序列为n个标记X = [x_{1},…],x_{n}],prompt P,目标提取序列Y = [y_{1},…], y_{m}],目标是在自回归公式中最大化条件概率:

其中θ为llm的参数,llm可以被冻结或训练。在LLM时代,有几种任务提出在X后面附加额外的提示或指令P,以增强LLM任务的可理解性。

命名实体识别(NER)包括两个任务:实体识别实体分类。前一个任务关注于识别实体的跨度(“Steve”),后一个任务关注于为这些已识别的实体分配类型(“PERSON”)。

关系提取(RE)在不同的任务中可能有不同的设置。(1)关系分类是指对两个给定实体之间的关系类型进行分类;(2)关系三元组是指识别关系类型和对应的头尾实体跨度;(3)关系严格是指给出正确的关系类型、跨度和头尾实体的类型。

事件提取(EE)可分为两个子任务:

(1)事件检测(Event Detection)(在某些作品中也称为事件触发提取(Event Trigger Extraction)),目的是识别和分类最清楚地代表事件发生的触发词和类型。

(2)事件参数提取(Event Arguments Extraction)旨在从句子中识别和分类在事件中扮演特定角色的参数。

Information Extraction Tasks

Named Entity Recognition

Relation Extraction

 Event Extraction

 Universal Information Extraction

NL-LLMs:基于自然语言的方法将所有IE任务统一在一个通用的自然语言模式中。例如,UIE 提出了一个统一的文本到结构生成框架,该框架对提取结构进行编码,并通过结构化提取语言捕获常见的IE功能。InstructUIE通过为微调llm构建专家编写的指令来增强UIE,以一致地建模不同的IE任务并捕获任务间依赖性。此外,ChatIE 探索了在零次提示中使用GPT3和ChatGPT 等llm,将任务转化为多回合问答问题。 

Code-LLMs:基于代码的方法通过使用通用编程模式生成代码来统一IE任务。Code4UIE 提出了一个通用的检索增强代码生成框架,它利用Python类定义模式,并使用上下文学习来生成代码,从文本中提取结构知识。此外,CodeKGC 利用代码中固有的结构知识,并采用模式感知提示和理性增强生成来提高性能。为了使llm能够立即遵守指导方针,GoLLIE提出了通过微调llm以使其与注释指导方针保持一致来提高未见过的IE任务的零射门性能。

Future Directions

Universal IE

以前的生成式IE方法和基准通常是针对特定领域或任务量身定制的,限制了它们的通用性。虽然最近已经提出了一些使用llm的统一方法,但它们仍然存在一定的局限性(例如,长上下文输入和结构化输出的不对齐)。因此,进一步开发能够灵活适应不同领域和任务的通用IE框架是一个很有前途的研究方向(例如整合特定任务模型的见解来帮助构建通用模型)。

Low-Resource IE

具有llm的生成式IE系统在资源有限的情况下仍然面临挑战。基于总结,有必要进一步探索LLM的情境学习,特别是在改进示例选择方面。未来的研究应优先发展稳健的跨领域学习技术,如领域适应或多任务学习,以利用来自资源丰富领域的知识。此外,还应该探索使用llm的高效数据注释策略。

Prompt Design for IE

设计有效的指令被认为对llm的绩效有显著影响。提示设计的一个方面是构建可以更好地与LLM的预训练阶段保持一致的输入和输出对。另一方面是通过鼓励LLM进行逻辑推理或可解释的生成来优化提示,以获得更好的模型理解和推理。此外,研究人员可以探索交互式提示设计(如多回合QA) ,LLM可以迭代地对生成的提取进行优化或自动提供反馈。

Open IE

open IE设置对IE模型提出了更大的挑战,因为它们不提供任何候选标签集,并且仅仅依赖于模型理解任务的能力。LLM凭借其知识和理解能力,在一些Open IE任务中具有显著优势然而,在更具挑战性的任务中仍然存在表现不佳的情况,这需要研究人员进一步探索。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3003749.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

双指针(C++)

文章目录 1、移动零2、复写零3、快乐数4、盛最多水的容器5、有效三角形的个数6、和为s的两个数7、三数之和8、四数之和 需要理解的是,双指针并非只有指针,双指针的意思是两个位置。比如对于数组来说,两个下标也是双指针。当然,也可…

如何维持CISSP证书:附免费获取CPE学分的16个官方渠道

CISSP 证书只有三年有效期(如2023.11-2026.10),需要每年维护才能续证。持证者需要持续获取 CPE 学分来维持证书,否则证书到期后将失效。本文主要介绍维护CISSP证书的2个必备条件及16个CPE学分官方获取渠道。 1. 证书维持的2个必备…

iOS 实现视图遮罩效果

有时候,我们会遇到这种需求,只讲视图的某个部分展示出来 这时候,我们可以通过设置该视图layer.mask layerb来实现,需要注意的是,这里的layerb必须要设置backgroundColor,渐变layer有colors,否则达不到效果…

欧拉计划第804题:二次多项式计数

题目描述: 第一步,先根据题意直接求解 先利用一元二次方程求根的公式进行推导 x 2 + y x + 41 y 2 − n = 0 x^2 + yx + 41y^2 - n = 0

GPT3 终极指南(二)

原文:zh.annas-archive.org/md5/6de8906c86a2711a5a84c839bec7e073 译者:飞龙 协议:CC BY-NC-SA 4.0 第五章:GPT-3 作为企业创新的下一步 当一个新的创新或技术转变发生时,大公司通常是最后一个采纳的。它们的等级结构…

如何定时打开网站

首先,需要用到的这个工具: 度娘网盘 提取码:qwu2 蓝奏云 提取码:2r1z 1、打开工具按下Ctrl3,切换到定时器模块,左侧右键,选择新建 2、标题叫百度,等下就让它打开百度&#xff0c…

Java | Leetcode Java题解之第64题最小路径和

题目: 题解: class Solution {public int minPathSum(int[][] grid) {if (grid null || grid.length 0 || grid[0].length 0) {return 0;}int rows grid.length, columns grid[0].length;int[][] dp new int[rows][columns];dp[0][0] grid[0][0]…

持续更新|UNIAPP适配APP遇到的问题以及解决方案

在使用UNIAPP开发APP的时候遇到的一些奇奇怪怪问题记录 组件样式丢失 问题:组件引入界面中,在小程序和H5环境下样式正常,而在APP中却出现高度异常问题 解决:增加view标签将组件包裹起来即可正常显示 解决前: 解决后…

Mysql的关联查询以及语句

一、mysql的连接查询 1、等值连接 这里是三张表的等值连接 select rp.role_id,rp.permission_id from role_permission rp, role r, permission p where rp.role_idr.id and rp.permission_idp.id 2、内连接: 角色:系统管理员 是否拥有权限&#xf…

并发编程之线程池的设计和原理

一、线程池 提前创建一系列的线程,保存在这个线程池中,有任务要执行的时候,从线程池中取出线程来执行。没有任务的时候,线程池放回去。 二、为什么要使用线程池 线程使用上的问题: 线程的频繁创建 和 销毁 线程的数量过多&…

51. 【Android教程】JSON 数据解析

在上一节我们学习了 xml 数据格式,如果你觉得 xml 的数据比较冗余,标签、属性等等定义过于复杂,那么这一节我们将继续学习另一种更精简、更高效的数据格式—— Json。它广泛的运用于数据持久化以及网络传输中,这一节我们一起学习 …

ios CI/CD 持续集成 组件化专题五-(自动发布私有库-组件化搭建)

一:手动发布私有库总结 手动发布pod私有库,需要进行如下几步操作: 1、修改完代码之后,需要提交代码push到git仓库。 2、给代码打tag。 3、修改podspec文件的version值,使其和设置的tag一直。 4、命令行执行pod repo…

【C 数据结构】深度优先搜索、广度优先搜索

文章目录 【 1. DFS 深度优先搜索 】1.1 基本原理1.2 C 实现 【 2. BFS 广度优先搜索 】2.1 基本原理2.2 C 实现 【 3. 深度优先生成树、广度优先生成树 】【 4. 深度优先生成森林、广度优先生成森林 】4.1 深度优先生成森林4.2 广度优先生成森林 对存储的图中的顶点进行遍历搜…

Linux专栏08:Linux基本指令之压缩解压缩指令

博客主页:Duck Bro 博客主页系列专栏:Linux专栏关注博主,后期持续更新系列文章如果有错误感谢请大家批评指出,及时修改感谢大家点赞👍收藏⭐评论✍ Linux基本指令之压缩解压缩指令 编号:08 文章目录 Linu…

【python】python标准化考试系统[单项选择题 简易版](源码)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

【数据结构】链表专题3

前言 本篇博客我们继续来讨论链表专题,今天的链表算法题是经典中的经典 💓 个人主页:小张同学zkf ⏩ 文章专栏:数据结构 若有问题 评论区见📝 🎉欢迎大家点赞👍收藏⭐文章 目录 1.判断链表是否…

springboot 自动配置源码解读

什么是自动装配 当我们程序依赖第三方功能组件时,不需要手动将这些组件类加载到IOC容器中。例如 当程序需要用到redis时,在pom.xml文件中引入依赖,然后使用依赖注入的方式直接从IOC容器中拿到相应RedisTemplate实例。 SpringBootApplication …

jvm面试题30问

什么是JVM的跨平台? 什么是JVM的语言无关性? 什么是JVM的解释执行 什么是JIT? JIT:在Java编程语言和环境中,即时编译器(JIT compiler,just-in-time compiler)是一个把Java的字节码(…

为什么3D模型材质是透明的?---模大狮模型网

在进行3D建模和渲染过程中,正确的材质设置是保证模型外观逼真和渲染效果良好的关键之一。然而,有时您可能会遇到3D模型材质变成透明的情况,这可能会导致意想不到的效果和渲染结果。本文将探讨一些可能导致3D模型材质变成透明的原因&#xff0…

MySQL 运维篇

回顾基本语句: 数据定义语言(DDL) 这类语言用于定义和修改数据库的结构,包括创建、删除和修改数据库、 表、视图和索引等对象。 主要的语句关键字包括 CREATE 、 DROP 、 ALTER 、 RENAME 、 TRUNCATE 等。 create database 数据库 ; cr…