成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

【LLM&Agent】PPTAgent:PPT自動生成Agent框架

人工智能
來看一個PPT生成思路:PPTAgent。傳統的PPT生成方法通常使用端到端的文本生成范式,這種方法僅關注文本內容,忽略了布局設計和PPT結構。PPTAgent 采用了一種基于編輯的生成范式,解決處理空間關系和設計風格方面的挑戰。

來看一個PPT生成思路:PPTAgent。傳統的PPT生成方法通常使用端到端的文本生成范式,這種方法僅關注文本內容,忽略了布局設計和PPT結構。PPTAgent 采用了一種基于編輯的生成范式,解決處理空間關系和設計風格方面的挑戰。

傳統方法的每個幻燈片  可以用以下公式表示:

方法

PPTAgent框架PPTAgent框架

在本文中,PPTAgent 是一個用于自動生成PPT的框架。采用基于編輯的工作流程,分為兩個階段:PPT分析和PPT生成。

階段 I: PPT分析

主要目標是通過幻燈片聚類內容schema提取,為PPT生成提供結構化和語義化的參考信息。這一階段的結果將直接影響后續階段的生成質量和效率。

  • 幻燈片聚類

幻燈片聚類(層次聚類)是將參考PPT中的幻燈片按照其功能和內容進行分組的過程。幻燈片可以分為兩大類:聚類算法:

圖片圖片

  • 層次聚類

聚類示例聚類示例

a.結構性幻燈片:這些幻燈片主要用于支持演示文稿的結構,例如開場幻燈片、過渡幻燈片和結束幻燈片。對于此類幻燈片,PPTAgent利用LLM推斷每個幻燈片的功能角色,并根據這些角色進行分組。這些幻燈片通常具有明顯的文本特征。

b.內容性幻燈片:這些幻燈片主要用于傳達具體的信息,例如包含項目符號、圖表和圖像的幻燈片。對于此類幻燈片,PPTAgent采用基于圖像相似性的層次聚類方法。通過計算幻燈片之間的圖像相似度,將相似的幻燈片歸為一組。

  • 內容Schema提取
    完成幻燈片聚類后,PPTAgent進一步分析每個聚類的內容Schema,以確保編輯的目標一致性。由于現實世界中的幻燈片可能非常復雜且碎片化,PPTAgent利用LLM的上下文感知能力提取多樣化的內容Schema。PPTAgent定義了一個內容Schema提取框架,其中每個元素由其類別模態內容表示。基于這個框架,PPTAgent通過LLM的指令遵循(原文給出了相關prompts)和結構化輸出能力,從每個幻燈片中提取內容Schema。提取過程如下:

a.類別:描述元素的類型,例如文本框、圖像等。

b.模態:描述元素的呈現方式,例如純文本、帶圖形的文本等。

c.內容:描述元素的具體內容,例如文本內容或圖像的替代文本。

階段 II:PPT生成

圖片圖片

第二階段是基于第一階段的分析結果,生成新的PPT。這一階段的核心是通過交互式的編輯過程,利用參考幻燈片和輸入文檔生成目標PPT。步驟包括:生成一個結構化的大綱,指定每個幻燈片的參考幻燈片和相關內容;使用LLMs迭代編輯參考幻燈片以生成新幻燈片;實現五個專門的API,允許LLMs編輯、刪除和復制文本元素,以及編輯和移除視覺元素。

大綱生成:大綱生成是根據人類偏好,指導LLM創建一個結構化的大綱。每個條目指定參考幻燈片、相關文檔部分索引以及新幻燈片的標題和描述。通過利用LLM的規劃和總結能力,結合從參考PPT中提取的語義信息,生成一個連貫且吸引人的大綱,從而指導新PPT的生成過程。

幻燈片生成:幻燈片生成是在大綱的指導下,通過迭代編輯參考幻燈片來生成新幻燈片的過程。為了實現對幻燈片元素的精確操作,PPTAgent實現了五個專門的API,允許LLM編輯、刪除和復制文本元素,以及編輯和刪除視覺元素。此外,為了增強對幻燈片結構的理解,PPTAgent將幻燈片從其原始XML格式轉換為HTML表示,這種表示形式更易于LLM解釋

實驗

評價指標,現有的指標包括:

  • 成功率(Success Rate, SR)
  • 困惑度(Perplexity, PPL)
  • Fréchet Inception Distance(FID)

PPTEval指標包括:

  • 內容(Content)
  • 設計(Design)
  • 連貫性(Coherence)
  • 平均分(Avg.)

這些指標用于評估生成的PPT在不同維度上的質量。

圖片

參考文獻

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides,https://arxiv.org/pdf/2501.03936v1

責任編輯:武曉燕 來源: 大模型自然語言處理
相關推薦

2025-05-30 14:59:36

GoogleAgent2AI

2025-06-23 09:26:24

2024-05-28 09:24:32

2025-06-23 08:30:05

2024-09-30 14:40:00

AI強化學習框架

2024-11-14 18:39:23

2024-05-29 12:35:34

2025-02-17 10:36:00

微軟開源模型

2023-08-18 17:25:45

掘力計劃大語言模型

2010-11-10 11:05:38

2010-07-09 14:26:10

SNMP Agent

2011-03-29 10:22:35

Zabbix Agen安裝

2011-03-29 14:37:47

Zabbix Agen配置

2025-06-10 04:00:00

2025-01-17 09:30:21

2022-11-27 23:37:33

Agent對象存儲

2025-05-09 08:45:13

2024-07-01 12:30:09

2024-12-24 16:30:58

Agent
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费毛片www com cn | 国产日韩欧美电影 | 国产欧美一区二区三区在线看 | 亚洲一区在线日韩在线深爱 | 国产欧美在线观看 | 福利片在线观看 | 亚洲九九 | 三级视频久久 | 成人黄色a| 欧产日产国产精品99 | 国产精品视频久久久 | 99视频免费在线 | 丁香久久 | 久久精品国产一区二区三区不卡 | 国产精品91久久久久久 | 人人九九精| 精品久久久久久一区二区 | 国产精品国产三级国产aⅴ入口 | 国产成人精品免高潮在线观看 | 色综合久久久久 | 亚洲福利视频一区二区 | 国产做爰 | 91精品国产综合久久久久久蜜臀 | 国产成人在线播放 | 久久久久免费精品国产 | 欧产日产国产精品99 | 日日操av | 国产一区在线免费 | 欧美精品一区二区三区在线 | 久久国色 | 午夜视频在线免费观看 | 国产一区二区三区在线 | 国产精品视频一区二区三区 | 91视在线国内在线播放酒店 | 国产欧美日韩综合精品一区二区 | 国产高清一区二区三区 | 欧美激情一区二区 | 五月婷婷婷 | 欧美在线视频一区二区 | 成人精品在线视频 | 一级黄a视频 |