arXiv:2205.07830 Abstract | arXiv Analytics

arXiv:2205.07830 [cs.CL]Abstract References Reviews Resources

FactPEGASUS: Factuality-Aware Pre-training and Fine-tuning for Abstractive Summarization

Published 2022-05-16Version 1

We present FactPEGASUS, an abstractive summarization model that addresses the problem of factuality during pre-training and fine-tuning: (1) We augment the sentence selection strategy of PEGASUS's (Zhang et al., 2020) pre-training objective to create pseudo-summaries that are both important and factual; (2) We introduce three complementary components for fine-tuning. The corrector removes hallucinations present in the reference summary, the contrastor uses contrastive learning to better differentiate nonfactual summaries from factual ones, and the connector bridges the gap between the pre-training and fine-tuning for better transfer of knowledge. Experiments on three downstream tasks demonstrate that FactPEGASUS substantially improves factuality evaluated by multiple automatic metrics and humans. Our thorough analysis suggests that FactPEGASUS is more factual than using the original pre-training objective in zero-shot and few-shot settings, retains factual behavior more robustly than strong baselines, and does not rely entirely on becoming more extractive to improve factuality. Our code and data are publicly available at: https://github.com/meetdavidwan/factpegasus

Comments: NAACL 2022 (19 pages)

Categories: cs.CL, cs.AI, cs.LG

Keywords: abstractive summarization, factpegasus, factuality-aware pre-training, fine-tuning, better differentiate nonfactual summaries

Related articles: Most relevant | Search more

arXiv:2204.02208 [cs.CL] (Published 2022-04-05)

Abstractive summarization of hospitalisation histories with transformer networks

Alexander Yalunin, Dmitriy Umerenkov, Vladimir Kokh

arXiv:2106.01317 [cs.CL] (Published 2021-06-02)

Enriching Transformers with Structured Tensor-Product Representations for Abstractive Summarization

Yichen Jiang et al.

arXiv:1803.11070 [cs.CL] (Published 2018-03-28, updated 2018-08-15)

Actor-Critic based Training Framework for Abstractive Summarization

Piji Li, Lidong Bing, Wai Lam

arXiv Analytics

arXiv:2205.07830 [cs.CL]Abstract References Reviews Resources

FactPEGASUS: Factuality-Aware Pre-training and Fine-tuning for Abstractive Summarization

Links

Toolbox

arXiv:2205.07830 [cs.CL]AbstractReferencesReviewsResources

FactPEGASUS: Factuality-Aware Pre-training and Fine-tuning for Abstractive Summarization

Links

Toolbox

arXiv:2205.07830 [cs.CL]Abstract References Reviews Resources