آرش غفوری

 | تاریخ ارسال: 1405/2/22 | 
 

 آقای آرش غفوری دانشجوی دکتری  دکتر نادری مورخ: ۱۴۰۵/۰۳/۱۰ ساعت: ۱۴:۰۰ از رساله دکتری خودباعنوان «ارائه یک الگوریتم بازیابی دانش مبتنی بر فنون متن‌کاوی برای بهبود سامانه‌های پرسش‌وپاسخ» دفاع خواهند نمود.
(ادامه مطلب)


 

دانشجو: آرش غفوری

استاد راهنما:  دکترحسن نادری

استاد مشاور: دکتربهروز مینایی بیدگلی ؛ دکتر محمد رضا حسنی آهنگر
اعضاء هیات داوری:  دکتر آزاده شاکری ؛ دکتر هادی علاییان؛
دکتر محمدرضا کنگاوری، دکتر حسین رحمانی

 

 تاریخ دفاع:  یکشنبه ۱۰ خرداد ماه                  ساعت:  ۱۴
   محل:     کلاس مجازی


 

چکیده
پاسخ‌گویی به پرسش‌های پیچیده چندگامی بر روی اسناد طولانی، از چالش‌های اساسی بازیابی اطلاعات و پردازش زبان طبیعی است. این مسئله نیازمند استخراج شواهد پراکنده، پیوند واحدهای اطلاعاتی ناهمگن و استدلال چندگامی است. روش‌های پیشین در مدل‌سازی صریح وابستگی‌های چندسطحی، ردیابی‌پذیری استدلال و مهار «توهم» در مدل‌های زبانی بزرگ با محدودیت مواجه‌اند. مسئله اصلی این رساله، طراحی الگوریتم بازیابی دانش مبتنی بر متن‌کاوی است که با ترکیب انتخاب شواهد و استدلال صریح، عملکرد سامانه را بهبود بخشد. در این راستا، ابتدا مدل محاسباتی گراف‌محور «هتروگراف» ارائه شده است که پاسخ‌گویی را در قالب «استدلال چندبُعدی بر پایه گراف ناهمگن» صورت‌بندی می‌کند. دانش بازیابی‌شده در این مدل، شامل انواع گره‌ها و روابط معنایی، در ساختاری «پاسخ‌محور» سازمان‌دهی می‌شود تا مسیرهای منتهی به پاسخ بیشینه شوند. با استفاده از سازوکار انتشار پیام، اطلاعات تجمیع شده و پاسخ از طریق نگاشت محاسباتی صریح استخراج می‌گردد. این ویژگی سبب ارتقای فهم ساختاری متن و ردیابی مسیر استدلال نسبت به روش‌های استدلال ضمنی می‌شود. در بخش دوم، رویکرد مکمل «بکترینوس» مبتنی بر مدل‌های زبانی بزرگ (نسخه‌های ۸ و ۷۰ میلیارد پارامتری) توسعه یافته است تا تفاوت میان استدلال صریح گراف‌محور و استدلال ضمنی تحلیل شود. نتایج تجربی نشان می‌دهد مدل «هتروگراف» با دستیابی به ۷۸.۷۱٪ در معیار تطابق‌دقیق و ۸۶.۵۱٪ در معیار اف‌وان، نسبت به بهترین روش موجود به ترتیب ۶.۰۲ و ۱.۴۷ واحد درصد بهبود یافته است. همچنین، مدل «بکترینوس» (۷۰ میلیاردی) با ۸۹.۰۱٪ در معیار اف‌وان، برتری خود را در پوشش معنایی ثابت کرده و در مقایسه با رقبا، ۲.۳۸ واحد درصد در تطابق‌دقیق و ۳.۹۷ واحد درصد در اف‌وان بهبود نشان می‌دهد. از منظر کارایی، هتروگراف با زمان استنتاج ۱۲۰ میلی‌ثانیه، علاوه بر دقت، بیش از ۴۰۰٪ سریع‌تر از مدل‌های زبانی بزرگ عمل می‌کند. دستاورد محوری این پژوهش، کاهش شکاف میان «انتخاب شواهد» و «استدلال چندگامی صریح» است. این هدف از طریق سازمان‌دهی پاسخ‌محور شواهد در مدل هتروگراف و تحلیل نظام‌مند پارادایم استدلال ضمنی در مدل‌های زبانی محقق شده است. برآیند نتایج نشان می‌دهد اگرچه مدل‌های زبانی در تولید پاسخ‌های روان توانمندند، اما برای کاربردهای دانش‌محور حساس، اتکای صرف به استدلال ضمنی کافی نیست. بهره‌گیری از مدل‌های ساختاریافته در سازمان‌دهی دانش، نقشی تعیین‌کننده در افزایش اتکاپذیری و کاهش توهم ایفا می‌کند. این رساله مسیر آینده را به سمت راهکارهای ترکیبی هدایت می‌کند که صراحت ساختاریِ گراف‌محور را با توانمندی معنایی مدل‌های زبانی بزرگ پیوند می‌زند.
کلمات کلیدی: پاسخ‌گویی به پرسش‌های پیچیده، بازیابی دانش، گراف ناهمگن، شبکه‌های عصبی گرافی، استدلال چندگامی، مدل‌های زبانی، متن‌کاوی

Abstract
Answering complex multi‑hop questions over long documents is a fundamental challenge in information retrieval and natural language processing. This task requires selecting dispersed evidence, linking heterogeneous information units, and performing multi‑step reasoning. Previous approaches face limitations in explicitly modeling multi‑level dependencies, ensuring traceable reasoning, and mitigating hallucinations in large language models. The central objective of this dissertation is to design a knowledge‑retrieval algorithm based on text mining that enhances system performance by integrating evidence selection with explicit reasoning.
To address this, a graph‑based computational model named HeteroGraph is introduced, which formulates question answering as multi‑dimensional reasoning over a heterogeneous graph. Retrieved knowledge—including various node types and semantic relations—is organized in a answer‑centric graph structure that maximizes the presence of the answer and the paths leading to it. Using message‑passing mechanisms, information is aggregated across levels, and the final answer is extracted through an explicit computational mapping. This enables structured understanding of text and traceable reasoning, in contrast to methods relying on implicit inference.
In the second part, a complementary approach named Bacterinus, built upon large language models (۸B and ۷۰B parameters), is developed to analyze differences between explicit graph‑based reasoning and implicit LLM‑based inference. Experimental results show that HeteroGraph achieves ۷۸.۷۱% exact match and ۸۶.۵۱% F۱, improving over the best previous method by ۶.۰۲ and ۱.۴۷ points, respectively. The ۷۰‑billion‑parameter version of Bacterinus achieves ۸۹.۰۱% F۱, demonstrating superior semantic coverage and outperforming competitive models by ۲.۳۸ points in exact match and ۳.۹۷ points in F۱. In terms of efficiency, HeteroGraph achieves a ۱۲۰‑ms inference time, making it not only more accurate but also over ۴۰۰% faster than large language model–based approaches.
The core contribution of this research is reducing the gap between evidence selection and explicit multi‑step reasoning. This is achieved through answer‑centric organization of extracted evidence in HeteroGraph and systematic analysis of implicit reasoning paradigms in LLMs. While large language models demonstrate strong fluency and semantic coverage, relying solely on implicit reasoning is insufficient for knowledge‑intensive, high‑reliability applications. Structured, traceable models play a decisive role in improving reliability and reducing hallucinations. The dissertation therefore highlights future research directions toward hybrid solutions that combine the structural explicitness of graph‑based models with the semantic capabilities of large language models.

 Keywords: Complex Question Answering, Knowledge Retrieval, Heterogeneous Graph, Graph Neural Networks, Multi-hop Reasoning, Language Models, Text Mining.


 

دفعات مشاهده: 108 بار   |   دفعات چاپ: 18 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر