تجربه هوش مصنوعی و آینده
گفتگوی پوریا حداد، بنیانگذار مجموعه هوش مصنوعی فیلاگر با دکتر مسعود کاویانی، دانشمند ارشد داده در فیلیمیو و زبراکت آلمان درباره آینده هوش مصنوعی و تجربه آن در ایران
معرفی
فیوتاک، سلسله گفتگوهایی است با خبرگان درباره آینده و فناوری. در این اپیزود از سلسه گفتگوهایی دربارهی هوش مصنوعی و آینده، پوریا حداد، مدیرعامل شرکت هوش مصنوعی فیلاگر با دکتر مسعود کاویانی، دانشمند ارشد داده در فیلیمیو و زبراکت آلمان و متخصص در حوزههای یادگیری ماشین و علم داده، درباره اقتصاد هوش مصنوعی، دربارهی کاربردهای هوش مصنوعی و یادگیری ماشین در زندگی روزمره و صنایع مختلف صحبت کردهاند.
گفتگو با دکتر مسعود کاویانی نشان میدهد که هوش مصنوعی و یادگیری ماشین، پتانسیل عظیمی برای ایجاد تحولات اساسی در زندگی انسانها و صنایع مختلف دارند. با توجه به چالشهای موجود، نیاز به توسعه زیرساختهای مناسب و وضع قوانین شفاف برای بهرهبرداری بهینه از این فناوریها ضروری است. همچنین، آمادهسازی جامعه برای تغییرات آینده در بازار کار و مشاغل، از اهمیت بالایی برخوردار است.
این گفتگو با حمایت ویژه صندوق پژوهش فناوری غیر دولتی فناوریهای نوظهور دیجیتال و دبیرخانه برنامه ملی آینده نگاری علم و فناوری ایران و همراهی مجموعه ویکست و انجمن مدیریت فناوری و نوآوری ایران و با تهیهکنندگی صابر خسروی تهیه و تولید شده است.
پوریا حداد: سلام و خوش آمدید به پلتفرم FutureOf.ir. در این برنامه، ما درباره آینده تکنولوژی و فناوری صحبت میکنیم. امروز میزبان دکتر مسعود کاویانی، دانشمند ارشد داده فیلیمو و آپارات و متخصص علم داده شرکت Zebracat آلمان هستیم. دکتر کاویانی، خیلی خوش آمدید به FutureOf.ir. خوشحالیم که در خدمت شما هستیم.
دکتر کاویانی: سلام و درود بر شما و بینندگان عزیز. مسعود کاویانی هستم، در حال حاضر به عنوان دانشمند ارشد داده در شرکت صبا ایده (فیلیمو و آپارات) و مهندس یادگیری ماشین در شرکت Zebracat آلمان فعالیت میکنم. همچنین در دانشگاههای مختلفی از جمله دانشگاه رجایی، جهاد دانشگاهی، صنعتی شریف و دانشگاه بهشتی دروسی در حوزه هوش مصنوعی تدریس میکنم. علاوه بر این، مشاور یادگیری ماشین در شرکت همراه اول و مرکز نوآوری علم داده هستم و چندین سال است که در زمینه یادگیری ماشین، هوش مصنوعی و علم داده فعالیت میکنم.
پوریا حداد: بسیار عالی. بیایید با این موضوع شروع کنیم که برای افرادی که ممکن است اطلاعات کافی نداشته باشند، وقتی میگوییم دانشمند داده یا دانشمند ارشد داده در یک شرکت، دقیقاً منظورمان چیست و درباره چه کسی صحبت میکنیم؟
دکتر کاویانی: ببینید، هر فعالیتی که کاربر در یک پلتفرم انجام میدهد، منجر به تولید داده میشود. مثلاً وقتی در گوگل یا آپارات جستجو میکنید، دادهای در آن شرکت ایجاد میشود. با افزایش حجم این دادهها، تحلیل و پردازش آنها با استفاده از الگوریتمهای معمول مهندسی نرمافزار امکانپذیر نیست. در نتیجه، ما باید از الگوریتمهای یادگیری ماشین استفاده کنیم که این کار توسط یک متخصص علم داده انجام میشود. متخصص علم داده پس از چندین سال تجربه، به متخصص ارشد تبدیل میشود.
در واقع، هوش مصنوعی یک حوزه گسترده است که شامل بخشهای مختلفی مانند یادگیری ماشین، علم داده، رباتیک، فلسفه و اخلاق هوش مصنوعی و حکمرانی داده میشود. وظیفه یک مهندس یادگیری ماشین این است که با استفاده از دادهها، یک سیستم هوشمند ایجاد کند. این سیستم میتواند به صورت نرمافزاری یا فیزیکی باشد.
پوریا حداد: بسیار خوب. حال میخواهم بپرسم، وقتی میگوییم فیلیمو و آپارات از هوش مصنوعی استفاده میکنند، دقیقاً منظورمان چیست و چه کاربردی برای کاربران دارد؟
دکتر کاویانی: به طور کلی، هر شرکتی، چه فیلیمو و آپارات، چه دیجیکالا، دیوار یا اسنپ، قبلاً یک سری کارها را به صورت دستی و با استفاده از نیروی انسانی انجام میداد. به عنوان مثال، در آپارات ما گزینهای داریم به نام NSFW detection (تشخیص محتوای نامناسب). بسیاری از ویدیوها نباید در آپارات منتشر شوند، زیرا ممکن است محتوای نامناسب برای کاربران داشته باشند. این مسئله در یوتیوب، فیلیمو و سایر پلتفرمها نیز وجود دارد.
قبلاً این کار توسط یک اپراتور انسانی انجام میشد که یک به یک ویدیوها را بررسی میکرد تا مناسب بودن آنها را برای انتشار تأیید کند. اما اکنون این کار توسط هوش مصنوعی انجام میشود. به جای انسان، ما از یک الگوریتم هوش مصنوعی استفاده میکنیم که به صورت تخصصی به آن الگوریتم یادگیری ماشین میگوییم. این الگوریتم با سرعت بسیار بالاتر، به صورت 24 ساعته و بدون نیاز به مرخصی، تمام ویدیوها را بررسی میکند و بر اساس قواعدی که به آن آموزش داده شده، ویدیوها را فیلتر میکند.
مثلا اگر در یوتیوب محتوایی آپلود کنید که در آن خون دیده شود، سیستم به طور خودکار برچسب محدودیت میزند و به شما اطلاع میدهد که در این محتوا خون تشخیص داده شده است. این میتواند شامل مواردی مانند تیر خوردن یا زخمی شدن بدن باشد. سیستم به صورت هوشمند این موارد را تشخیص میدهد و دسترسی به ویدیوی شما را برای گروه محدودتری از افراد محدود میکند. ما در آپارات نیز از الگوریتم مشابهی استفاده میکنیم. همین الگوریتم در پلتفرمهایی مانند دیوار نیز کاربرد دارد، جایی که تصاویر آپلود شده باید قوانین خاصی را رعایت کنند. این فرآیند فیلترینگ دیگر توسط انسان انجام نمیشود، بلکه توسط یک سیستم هوشمند صورت میگیرد.
پوریا حداد: پس مدلهایی که شما از آنها صحبت میکنید، با ویدیوها یا تصاویری که ایمن نیستند آموزش دیدهاند، درست است؟
دکتر کاویانی: دقیقاً. ترکیبی از تصاویر ایمن و غیر ایمن به سیستم داده شده و ما تمایز بین آنها را به سیستم آموزش دادهایم. در واقع، نام دیگر الگوریتمهای یادگیری ماشین، الگوریتمهای شناسایی تمایز است. مانند انسانی که میتواند بین تصویر مناسب و نامناسب تفاوت قائل شود، اگر الگوریتم بتواند چنین کاری انجام دهد، به آن الگوریتم هوشمند میگوییم. این الگوریتم با استفاده از مجموعه بزرگی از تصاویر یا ویدیوهای سالم و ناسالم آموزش میبیند و پس از آن میتواند به طور مستقل تصاویر را برای ما فیلتر کند.
پوریا حداد: بسیار خوب است که این موضوع را مطرح کردید. همانطور که شما و همه میدانند، پس از معرفی برخی مدلهای زبانی مانند ChatGPT، هیجان زیادی در مورد هوش مصنوعی ایجاد شده است. بسیاری تصور میکنند که شروع تحولات هوش مصنوعی از حدود دو سال پیش بوده است. اکثر مردم هوش مصنوعی را بیشتر با هوش مصنوعی مولد میشناسند. اما واقعیت این است که شاید درصد استفاده از هوش مصنوعی در بخشهای دیگر، که شما به برخی از آنها اشاره کردید، بسیار بیشتر است، اگرچه افرادی که کمتر با این حوزه آشنا هستند، ممکن است کمتر از آن اطلاع داشته باشند.
من میخواهم بیشتر درباره این کاربردها صحبت کنیم. مثلاً، یکی از سیستمهایی که در فیلیمو و آپارات بسیار استفاده میشود، سیستمهای توصیهگر است که بر اساس سوابق ویدیوهایی که قبلاً دیدهاید، پیشنهاداتی برای تماشای بعدی ارائه میدهد. میتوانیم درباره این موضوع نیز صحبت کنیم؟
دکتر کاویانی: البته. باید توجه داشت که عمومیسازی هوش مصنوعی با واقعیت آن تفاوت زیادی دارد. تصویری که عموم مردم از هوش مصنوعی میبینند، با آنچه در پشت صحنه اتفاق میافتد، متفاوت است. به قول شوپنهاور، مردم تصویری از هوش مصنوعی میبینند، اما پشت آن اتفاقات دیگری در جریان است. مثلاً همین مدلهای زبانی بزرگ (LLM) که اکثریت جامعه در دو سه سال اخیر با آنها آشنا شدهاند، در واقع از دهه 1960 مورد مطالعه و توسعه بودهاند. ما حتی با نسخههای قبل از GPT-3 در سالهای 2012 و 2013 کار میکردیم. اما از GPT-3 به بعد، به دلیل نتایج بسیار خوبی که به دست آمد، مردم توانستند بیشتر با آن ارتباط برقرار کنند و شناخت بیشتری پیدا کنند.
همانطور که اشاره کردید، بسیاری از کارهایی که هوش مصنوعی انجام میدهد، محدود به این کاربردهای عمومی مانند چتباتها یا تولید محتوای صوتی و تصویری نیست. اینها کارهای جذابی هستند که توجه مخاطب را جلب میکنند، اما در واقع، بحث بسیار عمیقتر است و میتوان آن را به یک کوه یخ تشبیه کرد که مردم تنها نوک آن را میبینند.
در مورد سیستمهای توصیهگر که اشاره کردید، این یکی از سودآورترین بخشها برای هر کسب و کاری است. هدف این است که کاربران را تا حد ممکن بیشتر در وبسایت نگه دارند، چه در دیجیکالا که میخواهد محصول بیشتری بفروشد، چه در فیلیمو و آپارات که میخواهند ویدیوهای بیشتری نمایش دهند و طبیعتاً تبلیغات بیشتری را به نمایش بگذارند. در گذشته، بخش توصیهگر معمولاً با استفاده از الگوریتمهای ساده انجام میشد.
در گذشته، سیستمهای توصیهگر بسیار ساده بودند. به عنوان مثال، اگر کاربری یک لپتاپ از دیجیکالا خریداری میکرد، یک برنامهنویس الگوریتمی مینوشت که به طور خودکار یک موس را نیز به آن کاربر پیشنهاد دهد. اما امروزه، به دلیل افزایش چشمگیر حجم محصولات در فروشگاههای آنلاین مانند دیجیکالا یا تعداد ویدیوها در پلتفرمهایی مانند فیلیمو و آپارات، این روشهای ساده دیگر کارآمد نیستند.
در حال حاضر، ما مجبور به استفاده از الگوریتمهای پیشرفته هوش مصنوعی و یادگیری ماشین هستیم. این الگوریتمها بر اساس علایق کاربر و الگوهای رفتاری او در بازههای زمانی مختلف، محتوا یا محصولات مناسب را پیشنهاد میدهند. به عنوان مثال، در فیلیمو، سیستم ممکن است تشخیص دهد که یک کاربر خاص صبحها برنامههای کودک، بعدازظهرها فیلمهای خانوادگی و شبها فیلمهای اکشن یا ترسناک را ترجیح میدهد.
پوریا حداد: بله، این الگوهای رفتاری پیچیده هستند و نمیتوان آنها را با برنامهنویسی ساده پیادهسازی کرد. آیا میتوانید در مورد چگونگی عملکرد این الگوریتمها در تشخیص محتوای ویدیوها توضیح دهید؟
دکتر کاویانی: بله، حتماً. در سطح قابل توضیح هوش مصنوعی، ما الگوریتمهایی داریم که میتوانند محتوای ویدیو را بدون نیاز به تگها تشخیص دهند. برای مثال، تشخیص اینکه آیا یک ویدیو درباره ورزش، یک فیلم سینمایی یا یک آموزش آشپزی است. اما اگر بخواهیم عمیقتر به این موضوع نگاه کنیم، باید بگویم که الگوریتمها مانند انسانها فکر نمیکنند.
ما انسانها با استفاده از مفاهیم و کلمات فکر میکنیم، اما الگوریتمها در یک فضای برداری کار میکنند. به جای درک مفاهیم انتزاعی مانند “ورزش” یا “فیلم جنایی”، الگوریتمها الگوهای دادهای را تشخیص میدهند. آنها ممکن است عناصری مانند توپ، تور و چمن سبز را در یک ویدیوی ورزشی تشخیص دهند، اما لزوماً مفهوم “ورزش” را به شیوه انسانی درک نمیکنند.
هدف نهایی ما این است که کاربر را بیشتر در وبسایت نگه داریم. بنابراین، ما به الگوریتم میگوییم که هر الگویی را که در دادهها میبیند، تشخیص دهد. ما نگران این نیستیم که الگوریتم چگونه این کار را انجام میدهد یا چه نامی برای این الگوها میگذارد. ما فقط میخواهیم که الگوریتم بتواند پیشبینی کند که اگر کاربری صبح یک نوع خاص از محتوا را مشاهده کرده است، چه نوع محتوایی را احتمالاً بعدازظهر تماشا خواهد کرد.
در واقع، الگوریتم با استفاده از جبر خطی و فضاهای برداری کار میکند، نه با کلمات و مفاهیم انسانی. در نهایت، ما نتایج الگوریتم را میگیریم و رفتار کاربران را دنبال میکنیم تا ببینیم پس از مشاهده یک ویدیو، چه ویدیوی دیگری را احتمالاً تماشا خواهند کرد. این الگوهای رفتاری را سپس برای ارائه پیشنهادات به سایر کاربران استفاده میکنیم.
پوریا حداد: در این بخش، مایلیم درباره آینده فناوری، به ویژه مدلهای بزرگ زبانی (LLM) صحبت کنیم. این مدلها به نظر میرسد بخش قابل توجهی از آینده تکنولوژی را شکل خواهند داد. میخواهیم با جزئیات بیشتری به این موضوع بپردازیم و درباره جنبههایی که باعث هیجان یا نگرانی شدهاند، گفتگو کنیم. اما قبل از آن، بیایید توضیح دهیم که این مدلها دقیقاً چه کاری انجام میدهند.
دکتر کاویانی: بله، حتماً. LLM در واقع یک مدل یادگیری ماشین است که میتواند کلمه بعدی را بر اساس مجموعهای از کلمات قبلی پیشبینی کند. این مفهوم اصلی است که مدلهای زبانی بزرگ حول آن شکل گرفتهاند. آنچه برای کاربر جذاب میشود، این است که این کلمات پشت سر هم چیده شده، معنادار هستند. این قابلیت در مدلهای قدیمی وجود نداشت.
با استفاده از ساختارهای پیچیده، این مدلها میتوانند تشخیص دهند که چه کلماتی را باید پشت سر هم قرار دهند. اگرچه چگونگی دقیق این فرآیند برای ما مشخص نیست و از دیدگاه انسانی یک جعبه سیاه محسوب میشود، اما میتوانیم ببینیم که الگوریتم پس از درک یک موضوع، قادر است کلمات را به شکلی معنادار کنار هم قرار دهد.
پوریا حداد: بله، و این همان چیزی است که برای کاربران بسیار جذاب شده است. حال که کمی درباره ماهیت این مدلها صحبت کردیم، میخواهم به یک سؤال مهم بپردازیم که احتمالاً برای بسیاری مطرح است. برخی تصور میکنند وقتی با مدلهای زبانی مانند ChatGPT، Gemini از Google، یا سرویسهای مشابه صحبت میکنند و پاسخی دریافت میکنند، این مدلها واقعاً آگاهی دارند و میدانند چه پاسخی میدهند. مثلاً، برخی از مدل زبانی میپرسند که آیا قصد نابودی دنیا را دارد یا نه، و وقتی پاسخی میشنوند، با هیجان آن را منتشر میکنند. میتوانید در این مورد توضیح دهید؟
دکتر کاویانی: بله، دقیقاً. ببینید، کسانی که با Google کار کردهاند – که تقریباً همه افراد این تجربه را دارند – میدانند که Google به هر سؤالی پاسخ میدهد. اما ما انسانها، وقتی بزرگ شدیم، فهمیدیم که این Google نیست که مستقیماً پاسخ میدهد. Google در واقع فقط یک موتور جستجوست. مثلاً وقتی ما “طرز تهیه قورمه سبزی” را جستجو میکنیم، Google تمام سایتهایی که حاوی این عبارت هستند را برای ما فهرست میکند.
ChatGPT دقیقاً همین کار را انجام میدهد، با این تفاوت که به جای فهرست کردن سایتها، کلماتی را که در آن سایتها پشت سر هم آمدهاند، جمعآوری کرده و بهترین ترکیب را برای ما خلاصه میکند. حتی در حال حاضر، وقتی شما برخی موضوعات تخصصی را در Google جستجو میکنید، در بالای صفحه خلاصهای از بهترین نتایج را مشاهده میکنید.
در واقع، این مدلها دانش پایهای از خود ندارند. اگر از دیدگاه یک جستجوگر نگاه کنیم، LLM یک موتور جستجوست که حجم عظیمی از دادهها – شامل تمام وبسایتها، Wikipedia جهانی، کتابخانه کنگره، و تقریباً تمام متون جمعآوری شده توسط انسانها – را در اختیار دارد. وقتی شما سؤالی میپرسید، این مدل در میان این دادههای عظیم جستجو میکند و میتواند کلمات را به صورت پیشفرض و با دقت بالا برای شما کنار هم قرار دهد.
پوریا حداد: پس خوب است که مخاطبان ما بدانند که وقتی درباره یک مدل زبانی صحبت میکنیم، لزوماً درباره آگاهی صحبت نمیکنیم، زیرا آگاهی مفهومی بسیار گستردهتر از آنچه ما در حال بحث درباره آن هستیم، میباشد. البته، این به این معنی نیست که این مدلهای زبانی اهمیت کمی دارند. قطعاً اینها دستاوردهای بسیار ارزشمندی هستند که همه ما در حال استفاده از آنها هستیم.
بسیار خوب، حال میخواهم نظر شما را درباره تأثیر این فناوری بر آینده جویا شوم. به نظر شما، تأثیر این فناوری بر کسبوکارها، چه در ایران و چه در سطح بینالمللی، چگونه خواهد بود؟ همچنین، چگونه این فناوری بر آینده مشاغلی که ما انسانها انجام میدهیم، تأثیر خواهد گذاشت؟
دکتر کاویانی: بله، این سؤال بسیار مهمی است. در واقع، ما درباره تأثیر گسترده یادگیری ماشین، به ویژه یادگیری ماشین مولد، صحبت میکنیم. این فناوری قادر است کلمات، تصاویر، صدا و حتی ویدیو را به شکلی معنادار تولید کند. این قابلیت محدود به زبان نیست و میتواند در حوزههای مختلف کاربرد داشته باشد.
اخیراً خبری منتشر شد مبنی بر اینکه یک شرکت هندی حدود 200 یا 2000 نفر از کارکنان بخش پشتیبانی خود را به دلیل استفاده از یک سیستم یادگیری ماشین مولد برای پاسخگویی به سؤالات مشتریان، اخراج کرده است. این نشان میدهد که بسیاری از مشاغل روتین، مانند پاسخگویی تلفنی، رسیدگی به تیکتها، ساخت ویدیوهای تبلیغاتی ساده، نگارش مقالات و تولید محتوای آموزشی، ممکن است به تدریج از بین بروند.
پوریا حداد: بله، به نظر میرسد که هوش مصنوعی مولد در مرحله اول میتواند بسیاری از مشاغل روتین را حذف کند. برای مثال، ویرایشگران ویدیو، نویسندگان مقالات علمی و غیرعلمی، و حتی سازندگان موسیقی ممکن است با چالشهایی مواجه شوند. در حال حاضر، هوش مصنوعی میتواند بسیاری از این وظایف را انجام دهد. به نظر میرسد که در فاز اول، مشاغلی که نیاز به خلاقیت پیچیده ندارند، توسط هوش مصنوعی مولد جایگزین خواهند شد. در فاز بعدی، ممکن است مشاغل خلاقانهتر نیز تحت تأثیر قرار گیرند.
دکتر کاویانی: دقیقاً. قبل از اینکه هوش مصنوعی مولد تا این حد پیشرفت کند و سختافزارهای لازم برای اجرای الگوریتمهای پیچیده با حجم بالای داده در دسترس قرار گیرد، تصور میشد که حوزههای هنری و خلاقانه آخرین بخشهایی خواهند بود که تحت تأثیر هوش مصنوعی قرار میگیرند. اما در واقع، این حوزهها از اولین بخشهایی بودند که تحت تأثیر قرار گرفتند. ما شاهد پیشرفتهای چشمگیری در زمینه تولید موسیقی، ساخت ویدیو و سایر هنرها بودهایم.
پوریا حداد: بله، این نکته بسیار جالبی است. در مورد سختافزار هم باید اشاره کنیم که بسیاری از الگوریتمهای امروزی به پردازندههای گرافیکی قدرتمند نیاز دارند تا بتوانند با حجم بالای داده کار کنند و مدلها را آموزش دهند. به طور خلاصه، ما به سه عنصر اصلی نیاز داریم: دادههای زیاد، سختافزار قوی و مدلهایی که بتوانند بین این دو ارتباط برقرار کنند.
پوریا حداد: اکنون میخواهم بدانم در مجموعههایی که فعالیت میکنید، با چه چالشهایی روبرو هستید. از دیدگاه فردی که به صورت عملی در این حوزه با دادهها و سختافزارها درگیر است، چه مشکلاتی را در ایران و خارج از کشور مشاهده میکنید؟
دکتر کاویانی: بله، مشکلاتی که در خارج از کشور وجود دارد، با تفاوتهایی در ایران نیز دیده میشود یا به زودی پدیدار خواهد شد. اولین چالش، بحث سختافزار است. الگوریتمهای یادگیری ماشین نیاز به پردازش بسیار زیادی دارند. مغز انسان هنگام تفکر، به دلیل فرآیندهای تکاملی، مانند یک لامپ 40 وات مصرف انرژی دارد. اما الگوریتمهای یادگیری ماشین برای پاسخگویی سریع به میلیونها کاربر، نیاز به انرژی بسیار بیشتری دارند.
پوریا حداد: درست است. این نیاز به انرژی بیشتر به معنای نیاز به برق بیشتر و GPUهای قدرتمندتر است. در حال حاضر، یکی از بزرگترین محدودیتها در جهان و به ویژه در ایران، همین محدودیت پردازنده است. در دنیای سرمایهداری غرب، این کار توسط شرکتهای بزرگی مانند مایکروسافت، آمازون و گوگل انجام میشود. اما در شرق، مانند چین و ایران، بیشتر این کار توسط دولتها صورت میگیرد.
دکتر کاویانی: بله، دقیقاً. در کشورهایی مانند ایران، چین یا هند، دولتها بیشتر زیرساختها را ایجاد میکنند. دولت سرمایهگذاری کلان انجام میدهد، نه فقط برای 10 یا 20 سال آینده، بلکه برای 50 یا 100 سال آینده. آنها GPU میخرند، منابع تهیه میکنند و کلاسترها را میسازند. حتی برخی منابع طبیعی مانند مناطق سردسیر یا منابع زیر آب را برای خنک کردن GPUها در اختیار شرکتها قرار میدهند.
پوریا حداد: این نکته جالبی است. به نظر شما در سالهای آینده، نیاز به این منابع سختافزاری کمتر میشود؟ آیا این به دلیل گذر از فاز بزرگی از آموزش الگوریتمهای اصلی است یا به این دلیل که الگوریتمها یاد گرفتهاند چگونه کارآمدتر از منابع استفاده کنند؟
دکتر کاویانی: بله، احتمالاً هر دو عامل نقش دارند. استفاده کارآمدتر از منابع در واقع همان یادگیری بیشتر است. الگوریتمها به سطح عمیقتری از دانش میرسند که دیگر نیاز به آموزش بسیار زیادی ندارد. این مانند یک پروفسور در یک رشته خاص است که دیگر نیاز به مطالعه کتابهای پایه ندارد و میتواند با خواندن چند مقاله در ماه، کارش را پیش ببرد.
پوریا حداد: یک مشکل دیگر، بحث قانونگذاری است. ما هنوز داده را به عنوان یک دارایی به رسمیت نمیشناسیم. در دنیای مدرن، حق کپیرایت مطرح شده، اما داده هنوز به صورت یک دارایی شناخته نمیشود. نظر شما در این مورد چیست؟
دکتر کاویانی: مسئله مالکیت داده در دنیای دیجیتال امروز بسیار پیچیده است. به عنوان مثال، وقتی شما در گوگل جستجو میکنید، مثلاً “طرز تهیه قورمه سبزی”، این دادهای است که شما تولید کردهاید و قاعدتاً باید متعلق به شما باشد، اما گوگل از آن استفاده میکند. در حال حاضر، مالکیت داده به طور دقیق مشخص نیست.
پوریا حداد: بله، دقیقاً. این مسئله در مورد پلتفرمهای دیگر مانند یوتیوب نیز صادق است. فرض کنید شخصی روزانه 20 تا 30 ویدیو در یوتیوب تماشا میکند. او از اینترنت و وقت خود استفاده میکند، اما یوتیوب است که دادههای مربوط به این فعالیت را جمعآوری میکند. این موضوع در دنیای مدرن بسیار مورد بحث است.
دکتر کاویانی: درست است. اتحادیه اروپا در حال وضع قوانین سختگیرانهای در مورد مالکیت داده است. در آنجا، شما میتوانید دادههای مربوط به خود یا خانوادهتان را از پلتفرمهایی مانند یوتیوب درخواست کنید. اما در ایران، ما هنوز چنین مقرراتی نداریم. در حال حاضر، داده متعلق به کسی است که سرور دارد و آن را ذخیره میکند، که به نظر میرسد رویکرد درستی نیست.
پوریا حداد: این موضوع با تکامل وب نیز ارتباط دارد. در وب 1.0، ارتباط یک طرفه بود و مالک داده میتوانست اطلاعات را منتشر کند و دیگران فقط میتوانستند آن را بخوانند. در وب 2.0، افراد احساس کردند که میتوانند دادههای خود را در پلتفرمهایی مانند یوتیوب یا گوگل منتشر کنند، اما هنوز مالکیت واقعی داده وجود ندارد زیرا شرکتها میتوانند در هر زمان آن دادهها را حذف کنند.
دکتر کاویانی: بله، و در وب 3.0، احتمالاً به سمتی میرویم که مالکیت دادهها متعلق به افراد باشد. این میتواند از طریق فناوریهایی مانند NFT یا روشهای دیگر انجام شود، جایی که مالکیت داده در یک شبکه به نام تولیدکننده یا مالک اصلی ثبت میشود.
این موضوع هنوز مورد بحث است. برخی مانند کمونیستها معتقدند که همه چیز باید متعلق به همه باشد، در حالی که سرمایهداران میگویند داده متعلق به کسی است که برای آن پول پرداخت میکند. هنوز مشخص نیست که چه اتفاقی خواهد افتاد.
این مسئله برای کسبوکارها چالشبرانگیز است، زیرا نمیدانند از کدام دادهها میتوانند استفاده کنند. مثلاً در مورد ChatGPT، اگر یک وبسایت خبری مانند ایسنا خبری تولید کند و ChatGPT از آن یاد بگیرد، این یادگیری متعلق به چه کسی است؟ تولیدکننده خبر یا هوش مصنوعی؟
پوریا حداد: دقیقاً. این مسئله در مورد کتابها و سایر منابع آموزشی نیز صادق است. اگر یک هوش مصنوعی از کتابی که من نوشتهام یاد بگیرد و سپس از این دانش برای تولید کد یا ارائه خدمات API استفاده کند، آیا من باید سهمی از درآمد حاصل از این API داشته باشم؟
دکتر کاویانی: بله، این سؤال مهمی است. اگر این موضوع حل نشود، ممکن است شرکتهای بزرگ فناوری بیش از حد قدرتمند شوند و افراد عادی که دانش اولیه را تولید کردهاند، نادیده گرفته شوند.
شرکتهای بزرگ گاهی اوقات از روشهای جسورانهتری استفاده میکنند. مثلاً گوگل در گذشته تعداد زیادی کتاب را بدون مجوز اسکن و دیجیتالی کرد. آنها میدانستند که این کار جریمه دارد، اما ترجیح دادند جریمه را بپردازند زیرا هزینه گرفتن مجوز برای هر کتاب بسیار بالاتر بود.
این استراتژی به آنها مزیت رقابتی قابل توجهی داد. احتمالاً بسیاری از مدلهای یادگیری ماشین که امروزه استفاده میکنند، بر اساس همان دادههای قدیمی است که جمعآوری کردهاند.
تفاوت بین این روش و روشهای جدید یادگیری ماشین این است که در روش قدیمی، مثل اسکن کردن کتابها، منبع داده مشخص است و میتوان آن را ردیابی کرد. اما در مدلهای یادگیری ماشین مدرن، فرآیند یادگیری در یک “جعبه سیاه” انجام میشود که تشخیص منبع دقیق دادهها را دشوار میکند.
درست است که مدل از کتاب شما یادگیری را انجام داده، اما مشخص نیست که دقیقاً چگونه از این دانش استفاده میکند. ممکن است مفاهیم را به کار ببرد، اما تشخیص دقیق منبع دشوار است. با این حال، مالکیت معنوی همچنان متعلق به شماست و از نظر اخلاقی، باید جبران خسارتی صورت گیرد. در حال حاضر، این اتفاق نمیافتد و شرکتها به فعالیت خود ادامه میدهند.
احتمالاً در آینده، اگر دولتها قدرت کافی داشته باشند، شاهد وضع جریمههایی برای این موارد خواهیم بود. این نه تنها برای مدلهای زبانی بزرگ، بلکه برای تمام شرکتهایی که از هوش مصنوعی استفاده میکنند، اعمال خواهد شد. ممکن است از یک تاریخ مشخص به بعد، قوانینی وضع شود که استفاده از دادهها بدون پرداخت حق مالکیت به تولیدکننده اصلی را جریمه کند.
پوریا حداد: بله، این موضوع بسیار مهم است. حال، اجازه دهید در مورد وضعیت فعلی ایران در زمینه هوش مصنوعی و چشمانداز آینده صحبت کنیم. با توجه به محدودیتهایی که وجود دارد، از جمله مسائل سختافزاری و مشکلات مربوط به دسترسی به دادهها، چه پیشنهادی برای افرادی که میخواهند در این حوزه فعالیت کنند، دارید؟
دکتر کاویانی: در ایران، ما با چالشها و مزایایی روبرو هستیم. یکی از مزایای اصلی ما زبان فارسی است. ما حدود 120 میلیون نفر فارسیزبان داریم که میتوانند زبان فارسی را درک کنند. این یک نقطه قوت قابل توجه است، زیرا بسیاری از استارتآپهای خارجی در زمینه هوش مصنوعی در کار با زبان فارسی ضعیف عمل میکنند.
بسیاری از استارتآپهای ایرانی در حال حاضر بر روی زبان فارسی و محتوای مخصوص منطقه ما، شامل ایران، افغانستان و پاکستان تمرکز کردهاند. این محتوا در خارج از کشور کمتر مورد توجه قرار گرفته و ما میتوانیم در این زمینه پیشرفت قابل توجهی داشته باشیم.
مثلاً در حال حاضر برخی در حال کار بر روی یک مدل زبانی بزرگ فارسی هستند که میتواند پاسخهای پزشکی را به صورت پویا و به زبان فارسی ارائه دهد. این مدل میتواند با توجه به شرایط خاص ایران، مانند دسترسی به داروهای خاص، پاسخهای مناسبی ارائه دهد.
این نوع شخصیسازی و بومیسازی برای کاربران ایرانی میتواند یک مزیت رقابتی قابل توجه باشد.
یکی از مشکلات اصلی ما در ایران، کمبود نیروی متخصص است. با توجه به موج مهاجرت، ما با چالشهایی در این زمینه روبرو هستیم. ایجاد الگوریتمهای پیشرفته نیازمند یک تیم متخصص و یک چشمانداز بلندمدت، حداقل 5 تا 6 ساله است.
این فرآیند شامل سنجش نیاز، پیادهسازی و ورود به بازار است که زمانبر است. بدون نیروی متخصص کافی، ما نمیتوانیم چنین مدلهایی را بسازیم و از دنیا عقب میافتیم و اگر این فاصله زمانی بیشتر شود، ممکن است به نقطهای برسیم که دیگر نتوانیم به سطح جهانی برسیم. الگوریتمها به سرعت پیشرفت میکنند و اگر ما نتوانیم همگام شویم، ممکن است در آینده حتی نیروی لازم برای ساخت مدلهای پیشرفته را نداشته باشیم.
در واقع، به نظر من منابع انسانی در ایران وجود دارد، اما انگیزه کافی برای ماندن و ادامه کار در این حوزه وجود ندارد. آیندهای که افراد باید ببینند تا برای ماندن و تکمیل پروژههای استارتاپی انگیزه پیدا کنند، شاید کمتر از انگیزهای باشد که در خارج از ایران میتوانند داشته باشند.
از طرفی، به دلیل محدودیتها، ما نمیتوانیم به راحتی از منابع سختافزاری جهانی مانند آمازون و گوگل استفاده کنیم. اگر بخواهیم این زیرساختها را در ایران پیادهسازی کنیم، طبیعتاً بازده اقتصادی برای یک شرکت خصوصی نخواهد داشت. در اینجا دولت باید وارد شود و منابع سختافزاری لازم را ایجاد کند تا افراد بتوانند ایدههای خود را روی این منابع پیادهسازی کنند. حمایت دولتی میتواند نقش کلیدی در توسعه زیرساختهای لازم داشته باشد.
مسئله دیگر، بحث قانونگذاری است. افراد نگران هستند که اگر مدلی را بسازند و در آینده قوانین تغییر کنند، چه اتفاقی برای کار آنها خواهد افتاد. این موضوع ریسک سرمایهگذاری در حوزه هوش مصنوعی را بسیار بالا میبرد. عدم ثبات قانونی میتواند مانع بزرگی برای نوآوری و سرمایهگذاری باشد.
اما از طرف دیگر، ما مزایایی هم داریم. همانطور که قبلاً اشاره کردم، به دلیل محلی بودن و تمرکز بر زبان فارسی، میتوانیم در این حوزه مانور خوبی داشته باشیم و مدلهای هوش مصنوعی مختص منطقه خودمان را ایجاد کنیم.
پوریا حداد: اگر بخواهیم سه مشکل اصلی یعنی منابع انسانی، سختافزار و داده را در نظر بگیریم، به نظر شما کدام یک در چند سال آینده مهمترین چالش خواهد بود؟
دکتر کاویانی: به نظر من، در حال حاضر منابع انسانی مهمترین چالش است. چرا که فعلاً این منابع انسانی هستند که الگوریتمها را میسازند. شاید 20 یا 30 سال بعد، خود الگوریتمها بتوانند الگوریتم بسازند، اما در حال حاضر، منابع انسانی چالش اصلی ما هستند.پس از آن، میتوانیم قانونگذاری، داده و منابع سختافزاری را که معمولاً در ایران کمیاب هستند، در نظر بگیریم.
پوریا حداد: بسیار خوب، ممنون از صحبتهای ارزشمندتان. آیا نکته دیگری هست که فکر میکنید خوب است در موردش صحبت کنیم و نکردهایم؟
دکتر کاویانی: بله، اجازه دهید یک نکته کلی را اضافه کنم. در چند سال اخیر، هایپهای مختلفی از بلاکچین گرفته تا شبکههای اجتماعی مختلف مانند اینستاگرام، تیکتاک و دیسکورد به وجود آمدهاند. به نظر میرسد همه اینها به تدریج کنار میروند، اما چیزی که من میبینم این است که بحث هوش مصنوعی حداقل تا 10 یا 20 سال آینده جزو هایپهایی است که قرار نیست کنار برود.
پوریا حداد: این مقایسه جالبی است. میتوانید بیشتر توضیح دهید؟
دکتر کاویانی: بله، زمانی میگفتند اینترنت یک هایپ است که بعد از دو سه سال کنار میرود و دوباره همان مدل روزنامه و تلویزیون باقی میماند. اما دیدیم که واقعاً اینترنت چیزی بود که هایپ شد، هنوز هم هست و در آینده هم خواهد بود. به نظر من هوش مصنوعی چیزی است که واقعاً میشود روی آن سرمایهگذاری کرد.مثلاً کشورهایی مانند امارات و قطر در حال ایجاد وزارتخانه هوش مصنوعی هستند، در حالی که این اتفاق برای چیزی مثل متاورس یا بلاکچین نیفتاده است.
متاورس، بلاکچین و حتی شبکههای اجتماعی که میبینیم، همه زیرمجموعه اینترنت هستند. اما به نظر میرسد هوش مصنوعی چیزی است که قرار است فراتر از آن برود و به تدریج جای انسان هوشمند را تا شاید 40 یا 50 سال آینده در بسیاری از کارها بگیرد.
پوریا حداد: پس اگر بخواهیم یک نگاه به آینده هوش مصنوعی داشته باشیم، شما چطور آن را میبینید؟
دکتر کاویانی: به نظر من، هوش مصنوعی یک تکنولوژی پیشرو است که بعضی از تکنولوژیهای دیگر مانند بلاکچین و خیلی چیزهای دیگر دارند از مزایای آن استفاده میکنند و با آن ترکیب میشوند. تأثیر آن روی آینده 40 یا 50 سال دیگر بر انسانها چشمگیر خواهد بود.
فکر میکنم ما وارد دنیای جدیدی میشویم. همه ما دوران کودکی خود را به یاد داریم که تنها راه ارتباطی ما با دیگران یا به صورت حضوری بود یا نهایتاً تلفنی، که آن هم محدودیتهای خاص خودش را داشت. اما وقتی گوشیهای هوشمند و اینترنت آمدند، دیدیم که در این 20 سال، کل سبک زندگی ما عوض شد.
اینترنت، شبکههای اجتماعی و گوشیهای هوشمند همه تبدیل به یک سبک زندگی جدید شدند و در واقع یک تمدن جدید را پایهگذاری کردند. اگر بخواهیم مقایسه کنیم، انسانها در 4000 سال قبل تقریباً یک طور زندگی میکردند، اما در این 20 سال اخیر، تغییرات به قدری زیاد بوده که شاید به اندازه آن 4000 سال، سبک زندگیها عوض شده است.
آنچه که من در حال حاضر احساس میکنم و مقالاتی که منتشر میشوند نشان میدهند، این است که احتمالاً تا 40 یا 50 سال آینده، ما شاهد یک تغییر پارادایم اساسی خواهیم بود. شاید ما دیگر دانشمندان را به شکل امروزی نداشته باشیم. افرادی مانند مریم میرزاخانی ممکن است آخرین نسل از دانشمندان انسانی باشند.
پوریا حداد: این پیشبینی بسیار جالب توجه است. میتوانید بیشتر توضیح دهید؟
دکتر کاویانی: بله، به نظر میرسد که دانشمندان آینده، الگوریتمهایی خواهند بود که میتوانند فکر کنند، مسائل ریاضی را حل کنند و از نتایج خود استفاده کنند. در واقع، ما دیگر دانشمند، مقالهنویس یا استاد دانشگاه به شکل سنتی نخواهیم داشت، زیرا سیستمهایی مانند ChatGPT این وظایف را انجام خواهند داد. وقتی این مشاغل از بین بروند، ارزشها تغییر میکنند و به تبع آن، سبک زندگی نیز دگرگون میشود و در نهایت، به نظر من، یک تمدن جدید شکل میگیرد.
پوریا حداد: این دیدگاه بسیار عمیق و تأملبرانگیز است. آیا فکر میکنید عوامل دیگری نیز در این تحول نقش خواهند داشت؟
دکتر کاویانی: بله، به نظر من موضوع اصلی زمانی آغاز میشود که ما بتوانیم از توانایی کامپیوترهای کوانتومی استفاده کنیم. کامپیوترهای کوانتومی که امروزه دربارهشان صحبت میکنیم، قادر خواهند بود فرآیندهایی را که شاید چند دهه برای ابرکامپیوترهای امروزی طول بکشد، در عرض چند ثانیه انجام دهند.این پیشرفت در قدرت محاسباتی میتواند تأثیرات شگرفی داشته باشد.
زمانی که قدرت پردازش ما به این حد برسد، احتمالاً ترکیب آن با مدلهای فعلی و دادههای عظیمی که جمعآوری شدهاند، رویدادی را رقم خواهد زد که ما واقعاً یک تغییر پارادایم بزرگ را تجربه خواهیم کرد. ما به سمتی میرویم که تمام اصول، حتی اصول تکنولوژی که امروز داریم، تغییر خواهند کرد.
پوریا حداد: میتوانید مثالی از این تغییرات بزنید؟
دکتر کاویانی: بله، مثلاً در حوزه رمزنگاری، ما امروز اصول خاصی داریم. برای مثال، برای انتخاب یک رمز قوی، توصیههایی مانند استفاده از کاراکترهای خاص داریم. یا در مورد بیتکوین، حل معادلات خاصی لازم است. اما وقتی قدرت پردازش ما به حدی برسد که همه اینها در کسری از ثانیه حل شوند، کل این نظام تغییر خواهد کرد.
پوریا حداد: این تغییرات چه تأثیری بر زندگی روزمره مردم خواهد داشت؟
دکتر کاویانی: پس از این تحولات، همانطور که شما اشاره کردید، ارزشهای انسانها تغییر خواهد کرد. احتمالاً برای بسیاری از افراد، کار کردن به شیوه سنتی دیگر یک ارزش نخواهد بود. مثلاً اینکه از ساعت 8 صبح تا 5 بعدازظهر سر کار بروند. احتمالاً مردم به سمت پیگیری سرگرمیهای جدید یا پیشرفت در بخشهای دیگری از فعالیتهایشان خواهند رفت.
پوریا حداد: آیا این تغییرات میتواند تأثیرات منفی هم داشته باشد؟
دکتر کاویانی: البته، ممکن است تأثیرات منفی هم وجود داشته باشد. ما هنوز آن دنیا را تجربه نکردهایم، اما شاید کار نکردن افراد تأثیرات منفی بر سلامت جسمی، روحی یا جنبههای دیگر زندگی داشته باشد.
اگر یک انسان 100 سال پیش را تصور کنید، مثلاً در زمان قاجار، اگر به او میگفتید که “من چیزی دارم که خیلی به آن مینازم، یک اکانت در اینستاگرام با 500 هزار فالوور”، اول اینکه اصلاً نمیفهمید چه میگویید و اگر هم میفهمید، احتمالاً فکر میکرد شما دیوانه هستید، چون این مفهوم با فضای فکری آن زمان سازگار نبود.احتمالاً همین اتفاق 50 سال آینده هم میافتد. یک سری چیزها ارزشمند میشوند که ما الان نمیدانیم چه هستند. شاید اگر کسی بگوید روی موضوع خاصی کار میکند، ما الان به آن بخندیم، ولی 50 سال دیگر این موضوع کاملاً ارزشمند شود و شاید خیلی از تمدنها حول آن شکل بگیرند.
پوریا حداد: پس شما معتقدید که ارزشهای فعلی ما ممکن است در آینده کاملاً تغییر کنند؟
دکتر کاویانی: بله، احتمال بسیار قوی، شاید بالای 90 درصد، وجود دارد که تا 50 سال آینده خیلی از چیزهایی که ما الان به عنوان ارزش قبول داریم، دیگر ارزش نباشند. مثلاً الان شغل شخص، سمت سازمانیاش، اینکه استاد دانشگاه است، چند مقاله منتشر کرده یا چند مسئله ریاضی را حل کرده، همه اینها ارزش محسوب میشوند. اما احتمالاً تا 50 سال دیگر هیچ کدام از اینها ارزش نخواهند بود.
پوریا حداد: این تغییرات میتواند حتی به داراییهای ما هم تسری پیدا کند؟
دکتر کاویانی: بله، حتی ممکن است داراییهایمان هم تغییر کنند. مثلاً اگر متاورس راه بیفتد، شاید داراییهایی که در دنیای دیجیتال داریم ارزش بیشتری از داراییهای فیزیکی داشته باشند. مثلاً زمانی آلومینیوم بسیار ارزشمند بود. هر کس یک قاشق آلومینیومی داشت، در زمان خودش بسیار ثروتمند محسوب میشد. در حالی که امروزه ما آلومینیوم را کنار جاده میاندازیم و هیچ اتفاقی هم نمیافتد. احتمال زیاد همین اتفاقات در مورد ارزشهای امروزی ما هم خواهد افتاد.
تنها کاری که ما میتوانیم بکنیم این است که منتظر بمانیم و اگر زنده ماندیم، این روزها را ببینیم. اگر نه، باید ببینیم نسل بعد چه کاری میخواهد انجام دهد.
پوریا حداد: بسیار عالی. از شما بسیار متشکرم. این گفتگو بسیار ارزشمند و آموزنده بود. من شخصاً بسیار از آن بهره بردم و خوشحالم که این فرصت را داشتیم. امیدوارم برای برنامههای بعدی هم این همراهی را با ما داشته باشید.
درباره این قسمت:
- عنوان: گفتگو با دکتر کاویانی درباره تجربه هوش مصنوعی و آینده
- مدت: ۵۸:۲۹
- تاریخ انتشار: ۲۴ خرداد ۱۴۰۳