TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance
Posted 云才哥
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance相关的知识,希望对你有一定的参考价值。
前言
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance是2021年5月发表在ACL上的文章。改文章主要介绍针对基于金融领域表格(Tabular)和文本(Textual)混合(Hybrid)(即结构化和非结构化混合数据)的数据进行问题回复的研究。
文章获取链接: 论文下载链接.
一、摘要(abstract)
在论文摘要中,作者介绍了现有的研究,忽视了混合数据的问题回答(QA)。
本文的创新工作,1、从实际财务报告中抽取样本,构建一个包含表格和文本的大型QA数据集,命名为 TAT-QA。2、为了对表格数值进行推理,本文提出了一个新的模型TAGOP。
数据集获取链接: TAT-QA下载链接.
二、引言(Introduction)
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
以上是关于TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance的主要内容,如果未能解决你的问题,请参考以下文章
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance
学习Question---持续更新Question和Answer进度20170812
c_cpp http://www.zhihu.com/question/27971703/answer/38857951
c_cpp http://www.zhihu.com/question/27229082/answer/35757023