﻿<?xml version="1.0" encoding="utf-8"?>
<ArticleSet>
  <ARTICLE>
    <Journal>
      <PublisherName>مرکز منطقه ای اطلاع رسانی علوم و فناوری</PublisherName>
      <JournalTitle>فصلنامه فناوری اطلاعات و ارتباطات ایران</JournalTitle>
      <ISSN>2717-0411</ISSN>
      <Volume>16</Volume>
      <Issue>61</Issue>
      <PubDate PubStatus="epublish">
        <Year>2024</Year>
        <Month>12</Month>
        <Day>7</Day>
      </PubDate>
    </Journal>
    <ArticleTitle>Energy-Efficient Fixed-Point Hardware Accelerator for Embedded DNNs</ArticleTitle>
    <VernacularTitle>بررسی سربارهای سخت‌افزاری و بهره‌وری انرژی در پیاده‌سازی انواع چندی‌سازی ممیزثابت در شتاب‌دهنده شبکه عصبی عمیق</VernacularTitle>
    <FirstPage>37</FirstPage>
    <LastPage>54</LastPage>
    <ELocationID EIdType="doi" />
    <Language>fa</Language>
    <AuthorList>
      <Author>
        <FirstName>مرضیه </FirstName>
        <LastName>مستعلی زاده</LastName>
        <Affiliation>دانشگاه تهران</Affiliation>
      </Author>
      <Author>
        <FirstName>سید علی</FirstName>
        <LastName>انصارمحمدی</LastName>
        <Affiliation>دانشگاه تهران</Affiliation>
      </Author>
      <Author>
        <FirstName>نجمه</FirstName>
        <LastName>نظری</LastName>
        <Affiliation>دانشگاه تهران</Affiliation>
      </Author>
      <Author>
        <FirstName>مصطفی</FirstName>
        <LastName>ارسالی صالحی نسب</LastName>
        <Affiliation>تهران</Affiliation>
      </Author>
    </AuthorList>
    <History PubStatus="received">
      <Year>2023</Year>
      <Month>7</Month>
      <Day>26</Day>
    </History>
    <Abstract>&lt;p&gt;Deep Neural Networks (DNNs) have demonstrated remarkable performance in various application domains, such as computer vision, pattern recognition, and natural language processing. However, deploying these models on edge-computing devices poses a challenge due to their extensive memory requirements and computational complexity. These factors make it difficult to deploy DNNs on low-power and limited-resource devices. One promising technique to address this challenge is quantization, particularly fixed-point quantization. Previous studies have shown that reducing the bit-width of weights and activations, such as to 3 or 4 bits, through fixed-point quantization can preserve the classification accuracy of full-precision neural networks. Despite extensive research on the compression efficiency of fixed-point quantization techniques, their energy efficiency, a critical metric in evaluating embedded systems, has not been thoroughly explored. Therefore, this research aims to assess the energy efficiency of fixed-point quantization techniques while maintaining accuracy. To accomplish this, we present a model and design an architecture for each quantization method. Subsequently, we compare their area and energy efficiency at the same accuracy level. Our experimental results indicate that incorporating scaling factors and offsets into LSQ, a well-known quantization method, improves DNN accuracy by 0.1%. However, this improvement comes at the cost of a 3&amp;times; decrease in hardware energy efficiency. This research highlights the significance of evaluating fixed-point quantization techniques not only in terms of compression efficiency but also in terms of energy efficiency when applied to edge-computing device.&lt;/p&gt;</Abstract>
    <OtherAbstract Language="FA">&lt;p&gt;یکی از کارآمدترین راه&amp;zwnj;کارهای فشرده&amp;zwnj;سازی و کاهش انرژی مصرفی شبکه&amp;zwnj;های عصبی عمیق در دستگاه&amp;zwnj;های نهفته، کوانتیزاسیون با استفاده از نمایش اعداد ممیز ثابت است. در سال&amp;zwnj;های اخیر، روش&amp;zwnj;های متنوعی برای بهبود صحت شبکه&amp;zwnj;های کوانتیزه&amp;zwnj;شده مطرح شده است که اغلب سربارهای محاسباتی زیادی به شبکه تحمیل می&amp;zwnj;کنند، اگرچه این موضوع تاکنون از دید طراحان شبکه&amp;zwnj;های عصبی عمیق پنهان مانده&amp;zwnj;است. در این پژوهش، روش&amp;zwnj;های مختلف کوانتیزاسیون ممیزثابت، بر اساس مولفه&amp;zwnj;های تاثیرگذار در سربارهای سخت افزاری، طبقه&amp;zwnj;بندی و مدل شده است. پس از آن، معماری&amp;zwnj;های سخت&amp;zwnj;افزاری ارائه&amp;zwnj;شده برای هریک از مدل&amp;zwnj;ها به صورت عادلانه، با در نظرگرفتن هزینه&amp;zwnj;فایده&amp;zwnj;ی بین صحت شبکه و بهره&amp;zwnj;وری انرژی سخت&amp;zwnj;افزار، بررسی و مقایسه می&amp;zwnj;شوند. نتایج نشان می&amp;zwnj;دهد تکنیک&amp;zwnj;هایی که برای کاهش خطای روش&amp;zwnj;های کوانتیزاسیون به کار گرفته می&amp;zwnj;شود، اگرچه به افزایش صحت شبکه&amp;zwnj;های عصبی منجر می&amp;zwnj;شود اما از طرف دیگر بهره&amp;zwnj;وری انرژی سخت&amp;zwnj;افزار را کاهش می&amp;zwnj;دهد. براساس نتایج شبیه&amp;zwnj;سازی، افزودن ضریب مقیاس و آفست به کوانتیزاسیون ممیزثابت LSQ، صحت شبکه را حدود 1/0 افزایش می&amp;zwnj;دهد اما بهره&amp;zwnj;وری انرژی سخت&amp;zwnj;افزار حدود 3 برابر کمتر شده است. این موضوع لزوم توجه به سربارهای سخت&amp;zwnj;افزاری را به&amp;zwnj;خصوص در سیستم&amp;zwnj;های نهفته، بیش از پیش نشان می&amp;zwnj;دهد.&lt;/p&gt;</OtherAbstract>
    <ObjectList>
      <Object Type="Keyword">
        <Param Name="Value">شبکه‌های عصبی عمیق، سیستم‌های نهفته، بهره‌وری انرژی، کوانتیزاسیون ممیزثابت</Param>
      </Object>
    </ObjectList>
    <ArchiveCopySource DocType="Pdf">http://jour.aicti.ir/en/Article/Download/43395</ArchiveCopySource>
  </ARTICLE>
</ArticleSet>