آقای آرش غفوریدانشجوی دکتری دکتر نادری مورخ: ۱۴۰۵/۰۳/۱۰ ساعت: ۱۴:۰۰ از رساله دکتری خودباعنوان «ارائه یک الگوریتم بازیابی دانش مبتنیبر فنون متنکاوی برای بهبود سامانههای پرسشوپاسخ» دفاع خواهند نمود. (ادامه مطلب)
دانشجو: آرش غفوری استاد راهنما:دکترحسن نادری استاد مشاور: دکتربهروز مینایی بیدگلی ؛ دکتر محمد رضا حسنی آهنگر اعضاء هیات داوری: دکتر آزاده شاکری ؛ دکتر هادی علاییان؛ دکتر محمدرضا کنگاوری، دکتر حسین رحمانی
تاریخ دفاع: یکشنبه ۱۰ خرداد ماه ساعت: ۱۴ محل: کلاس مجازی
چکیده پاسخگویی به پرسشهای پیچیده چندگامی بر روی اسناد طولانی، از چالشهای اساسی بازیابی اطلاعات و پردازش زبان طبیعی است. این مسئله نیازمند استخراج شواهد پراکنده، پیوند واحدهای اطلاعاتی ناهمگن و استدلال چندگامی است. روشهای پیشین در مدلسازی صریح وابستگیهای چندسطحی، ردیابیپذیری استدلال و مهار «توهم» در مدلهای زبانی بزرگ با محدودیت مواجهاند. مسئله اصلی این رساله، طراحی الگوریتم بازیابی دانش مبتنی بر متنکاوی است که با ترکیب انتخاب شواهد و استدلال صریح، عملکرد سامانه را بهبود بخشد. در این راستا، ابتدا مدل محاسباتی گرافمحور «هتروگراف» ارائه شده است که پاسخگویی را در قالب «استدلال چندبُعدی بر پایه گراف ناهمگن» صورتبندی میکند. دانش بازیابیشده در این مدل، شامل انواع گرهها و روابط معنایی، در ساختاری «پاسخمحور» سازماندهی میشود تا مسیرهای منتهی به پاسخ بیشینه شوند. با استفاده از سازوکار انتشار پیام، اطلاعات تجمیع شده و پاسخ از طریق نگاشت محاسباتی صریح استخراج میگردد. این ویژگی سبب ارتقای فهم ساختاری متن و ردیابی مسیر استدلال نسبت به روشهای استدلال ضمنی میشود. در بخش دوم، رویکرد مکمل «بکترینوس» مبتنی بر مدلهای زبانی بزرگ (نسخههای ۸ و ۷۰ میلیارد پارامتری) توسعه یافته است تا تفاوت میان استدلال صریح گرافمحور و استدلال ضمنی تحلیل شود. نتایج تجربی نشان میدهد مدل «هتروگراف» با دستیابی به ۷۸.۷۱٪ در معیار تطابقدقیق و ۸۶.۵۱٪ در معیار افوان، نسبت به بهترین روش موجود به ترتیب ۶.۰۲ و ۱.۴۷ واحد درصد بهبود یافته است. همچنین، مدل «بکترینوس» (۷۰ میلیاردی) با ۸۹.۰۱٪ در معیار افوان، برتری خود را در پوشش معنایی ثابت کرده و در مقایسه با رقبا، ۲.۳۸ واحد درصد در تطابقدقیق و ۳.۹۷ واحد درصد در افوان بهبود نشان میدهد. از منظر کارایی، هتروگراف با زمان استنتاج ۱۲۰ میلیثانیه، علاوه بر دقت، بیش از ۴۰۰٪ سریعتر از مدلهای زبانی بزرگ عمل میکند. دستاورد محوری این پژوهش، کاهش شکاف میان «انتخاب شواهد» و «استدلال چندگامی صریح» است. این هدف از طریق سازماندهی پاسخمحور شواهد در مدل هتروگراف و تحلیل نظاممند پارادایم استدلال ضمنی در مدلهای زبانی محقق شده است. برآیند نتایج نشان میدهد اگرچه مدلهای زبانی در تولید پاسخهای روان توانمندند، اما برای کاربردهای دانشمحور حساس، اتکای صرف به استدلال ضمنی کافی نیست. بهرهگیری از مدلهای ساختاریافته در سازماندهی دانش، نقشی تعیینکننده در افزایش اتکاپذیری و کاهش توهم ایفا میکند. این رساله مسیر آینده را به سمت راهکارهای ترکیبی هدایت میکند که صراحت ساختاریِ گرافمحور را با توانمندی معنایی مدلهای زبانی بزرگ پیوند میزند. کلمات کلیدی: پاسخگویی به پرسشهای پیچیده، بازیابی دانش، گراف ناهمگن، شبکههای عصبی گرافی، استدلال چندگامی، مدلهای زبانی، متنکاوی
Abstract Answering complex multi‑hop questions over long documents is a fundamental challenge in information retrieval and natural language processing. This task requires selecting dispersed evidence, linking heterogeneous information units, and performing multi‑step reasoning. Previous approaches face limitations in explicitly modeling multi‑level dependencies, ensuring traceable reasoning, and mitigating hallucinations in large language models. The central objective of this dissertation is to design a knowledge‑retrieval algorithm based on text mining that enhances system performance by integrating evidence selection with explicit reasoning. To address this, a graph‑based computational model named HeteroGraph is introduced, which formulates question answering as multi‑dimensional reasoning over a heterogeneous graph. Retrieved knowledge—including various node types and semantic relations—is organized in a answer‑centric graph structure that maximizes the presence of the answer and the paths leading to it. Using message‑passing mechanisms, information is aggregated across levels, and the final answer is extracted through an explicit computational mapping. This enables structured understanding of text and traceable reasoning, in contrast to methods relying on implicit inference. In the second part, a complementary approach named Bacterinus, built upon large language models (۸B and ۷۰B parameters), is developed to analyze differences between explicit graph‑based reasoning and implicit LLM‑based inference. Experimental results show that HeteroGraph achieves ۷۸.۷۱% exact match and ۸۶.۵۱% F۱, improving over the best previous method by ۶.۰۲ and ۱.۴۷ points, respectively. The ۷۰‑billion‑parameter version of Bacterinus achieves ۸۹.۰۱% F۱, demonstrating superior semantic coverage and outperforming competitive models by ۲.۳۸ points in exact match and ۳.۹۷ points in F۱. In terms of efficiency, HeteroGraph achieves a ۱۲۰‑ms inference time, making it not only more accurate but also over ۴۰۰% faster than large language model–based approaches. The core contribution of this research is reducing the gap between evidence selection and explicit multi‑step reasoning. This is achieved through answer‑centric organization of extracted evidence in HeteroGraph and systematic analysis of implicit reasoning paradigms in LLMs. While large language models demonstrate strong fluency and semantic coverage, relying solely on implicit reasoning is insufficient for knowledge‑intensive, high‑reliability applications. Structured, traceable models play a decisive role in improving reliability and reducing hallucinations. The dissertation therefore highlights future research directions toward hybrid solutions that combine the structural explicitness of graph‑based models with the semantic capabilities of large language models.
Keywords: Complex Question Answering, Knowledge Retrieval, Heterogeneous Graph, Graph Neural Networks, Multi-hop Reasoning, Language Models, Text Mining.