علم داده؛ پلی به آینده فناوری و تصمیم‌گیری هوشمند/چالش‌های کشور در «سوخت اصلی» توسعه هوش مصنوعی
علم داده؛ پلی به آینده فناوری و تصمیم‌گیری هوشمند/چالش‌های کشور در «سوخت اصلی» توسعه هوش مصنوعی
علم داده ترکیبی از دانش‌های متنوع شامل آمار، یادگیری ماشین، برنامه‌نویسی و تخصص‌های حوزه‌های کاربردی است و به گفته متخصصان، ارزشمندترین دارایی‌های یک سازمان، پس از نیروی انسانی، داده‌ها هستند و همچنین داده‌ها به‌عنوان «سوخت اصلی» سیستم‌های هوش مصنوعی و یادگیری ماشین عمل می‌کنند؛ چرا که با استفاده از تحلیل‌های علم داده، مدل‌های یادگیری ماشین بهبود می‌یابد و توانایی پیش‌بینی و تصمیم‌گیری این مدل‌ها ارتقاء می‌یابد..

علم داده؛ پلی به آینده فناوری و تصمیم‌گیری هوشمند/چالش‌های کشور در «سوخت اصلی» توسعه هوش مصنوعی

به گزارش واحد علم و فناوری خبرگزاری صبح اقتصاد رامین عابدی اصل، تحلیگر و کارشناس هوش مصنوعی ، داده‌ها را منبع گران‌بهایی دانست که شرکت‌ها و سازمان‌ها برای حفظ مزیت رقابتی و اتخاذ تصمیم‌های هوشمندانه خود نیاز به تحلیل و استفاده بهینه از داده‌ها دارند، گفت: علم داده به عنوان یکی از برجسته‌ترین رشته‌های چندمنظوره، ابزارهای قدرتمندی در اختیار ما قرار می‌دهد تا از دریای وسیع داده‌ها، دانش و بینش استخراج کنیم و با پیشرفت‌های چشمگیر در حوزه هوش مصنوعی و یادگیری ماشین، علم داده به پلی میان فناوری و تصمیم‌گیری‌های استراتژیک تبدیل شده است.

وی علم داده را ترکیبی از دانش‌های متنوع شامل آمار، یادگیری ماشین، برنامه‌نویسی و تخصص‌های حوزه‌های کاربردی دانست که به تحلیل داده‌های ساختاریافته و غیرساختاریافته کمک می‌کند و ادامه داد: در حالی که تحلیل داده بیشتر بر استفاده از روش‌های آماری برای بررسی داده‌های گذشته متمرکز است، علم داده با رویکرد پیش‌بینی و مدل‌سازی پیشرفته به کشف الگوهای پنهان و ایجاد سیستم‌های هوشمند می‌پردازد. تفاوت اصلی علم داده با آمار در این است که علم داده از ترکیبی گسترده‌تر از ابزارها و الگوریتم‌ها، از جمله یادگیری ماشین و شبکه‌های عصبی، برای تحلیل حجم وسیعی از داده‌های متنوع استفاده می‌کند.

عابدی اصل تاکید کرد: علم داده توانایی آن را دارد که در میان انبوهی از داده‌ها، الگوها و روابط پنهان را شناسایی کند و این الگوها همان بینشی است که می‌توان از داده‌ها استخراج کرد. این بینش بسته به نوع داده در حوزه‌های مختلف کاربرد دارد، از داده‌های هواشناسی گرفته تا تحلیل بازارهای مالی و بورس و .. و بدون شک، یکی از علومی که در آینده نیاز شدیدی به آن در بازار کار احساس خواهد شد، علم داده است. به عنوان مشاوره حوزه فناوری اطلاعات در چند سال گذشته تعداد زیادی از دانشجویان را به این رشته هدایت کرده‌ام، می‌توانم بگویم که این حوزه هم در داخل ایران و هم در خارج از کشور بازار کار بسیار خوبی دارد. همچنین، این رشته می‌تواند ایده‌های بسیاری برای کسب‌وکارهای استارت‌آپی ایجاد کند.

این تحلیلگر حوزه هوش مصنوعی با طرح این سؤال که چگونه علم داده به تصمیم‌گیری هوشمند در سازمان‌ها کمک می‌کند؟ خاطر نشان کرد: به اعتقاد من، ارزشمندترین دارایی‌های یک سازمان، پس از نیروی انسانی، داده‌های آن سازمان هستند و منظور من از داده‌ها تنها محتوای قابل ذخیره در بانک‌های اطلاعاتی نیست، بلکه تمام ارزش‌ها و موجودیت‌های سازمان، از رفتار مشتریان گرفته تا نحوه تعامل کارمندان، می‌تواند به عنوان داده سازمان دسته‌بندی شود. در این میان، علم داده به سازمان‌ها کمک می‌کند تا از این داده‌ها برای تصمیم‌گیری استفاده کنند؛ تصمیماتی که دقیق‌تر و قابل‌اعتمادتر از روش‌های سنتی هستند.

وی ادامه داد: برای مثال، با استفاده از مدل‌های پیش‌بینی و تحلیل داده‌های بزرگ، سازمان‌ها قادرند رفتار مشتریان را پیش‌بینی کرده، بازاریابی هدفمندتری انجام دهند و حتی هزینه‌های عملیاتی خود را بهینه‌سازی کنند. علم داده با ارائه تحلیل‌های عمیق و شناسایی الگوهای پنهان، به سازمان‌ها این امکان را می‌دهد که آینده را با دقت بیشتری پیش‌بینی کرده و استراتژی‌های مؤثرتری پیاده‌سازی کنند.

ابزارها و تکنیک‌های مورد نیاز در علم داده

عابدی اصل، انتخاب ابزار برای انواع مختلف پردازش‌ها را بسته به نوع و ساختار داده‌ها متفاوت دانست و گفت: با این حال، به طور کلی ابزارها و تکنیک‌های متنوعی در علم داده به کار می‌روند که شامل زبان‌های برنامه‌ نویسی مانند Python و R، کتابخانه‌های یادگیری ماشین همچون TensorFlow و Scikit-learn، و پلتفرم‌های کلان‌داده مانند Hadoop و Spark است. این ابزارها به متخصصان علم داده کمک می‌کنند تا داده‌های خام را پردازش کرده، مدل‌های پیچیده بسازند و نتایج قابل تفسیر ارائه دهند. همچنین، ابزارهایی مانند Jupyter Notebook محیط مناسبی برای آزمایش و توسعه مدل‌های علم داده فراهم می‌کنند، به‌طوری که امکان ترکیب تحلیل‌های مختلف و تصویری‌سازی داده‌ها را بهبود می‌بخشند.

وی تاکید دارد: تمام چالش‌های این فناوری از ذخیره‌سازی و مدیریت داده‌ها تا پردازش آنها حول محور داده می‌چرخند و ادامه داد: یکی از بزرگترین چالش‌ها، حجم عظیم داده‌ها است که نیاز به ذخیره‌سازی و پردازش کارآمد دارد. علاوه بر حجم، تنوع داده‌ها از منابع مختلف، مانند داده‌های ساختاریافته و غیرساختاریافته، و همچنین سرعت تولید داده نیز چالش‌های دیگری را به وجود می‌آورند و مدیریت این داده‌ها نیازمند زیرساخت‌های پیشرفته و مقیاس‌پذیر است. به عنوان مثال، استفاده از سیستم‌های توزیع‌شده و ذخیره‌سازی ابری می‌تواند به سازمان‌ها کمک کند تا به طور مؤثرتری به این چالش‌ها پاسخ دهند.

این کارشناس حوزه داده، اضافه کرد: همچنین، امنیت و حفظ حریم خصوصی داده‌ها نیز به دلیل حساسیت اطلاعات در بسیاری از حوزه‌ها، چالش مهم دیگری است که سازمان‌ها باید با آن مواجه شوند. اطمینان از این که داده‌ها به طور ایمن ذخیره و منتقل می‌شوند و در عین حال حریم خصوصی افراد حفظ می‌شود، از الزامات کلیدی در عصر دیجیتال است.

آینده علم داده چگونه خواهد بود؟

عابدی اصل گفت: شاید این تعریف که “دانش از داده به دست می‌آید” برای اکثر افرادی که در رشته‌های کامپیوتر تحصیل کرده‌اند، آشنا باشد. بله، دانش از داده به دست می‌آید و بنابراین داده و علمی که مسئولیت پردازش داده را دارد، می‌تواند بسیار مهم باشد. از این رو با توجه به رشد سریع حوزه‌های مرتبط با علم داده، آینده این رشته بسیار روشن به نظر می‌رسد و پیش‌بینی می‌شود که نقش آن در تحولات فناوری افزایش یابد. همچنین با رشد هوش مصنوعی، اینترنت اشیاء و پردازش‌های ابری، علم داده به یک بخش جدایی‌ناپذیر از تحول دیجیتال تبدیل خواهد شد.

به گفته وی کاربردهای علم داده در حوزه‌های پیشرفته‌تری مانند پزشکی شخصی‌سازی‌شده، خودروهای خودران و شهرهای هوشمند به‌طور گسترده‌تری به کار گرفته خواهند شد. علاوه بر این، علم داده با ایجاد مدل‌های پیش‌بینی دقیق‌تر و سیستم‌های خودمختار، به تغییر فرآیندهای کسب‌وکار و بهینه‌سازی تصمیم‌گیری‌ها کمک شایانی خواهد کرد.

چه مهارت‌ها و تخصص‌هایی برای ورود به حوزه علم داده لازم است؟

این تحلیلگر حوزه هوش مصنوعی اضافه کرد: افرادی که توانایی تحلیل بالایی دارند می‌توانند در علم داده به افراد نخبه این رشته تبدیل شوند؛ چرا که خوراک اصلی این رشته تحلیل و تحلیلگر بودن است، در کل برای ورود به علم داده، تسلط به زبان‌های برنامه‌نویسی مانند Python و R، آشنایی با الگوریتم‌های یادگیری ماشین و درک عمیق از ریاضیات و آمار ضروری است. همچنین، مهارت‌های پردازش داده‌های بزرگ و کار با پایگاه‌های داده، به همراه توانایی تصویری‌سازی داده‌ها، از مهارت‌های کلیدی محسوب می‌شوند.

وی ادامه داد: علاوه بر مهارت‌های فنی، توانایی تجزیه و تحلیل کسب‌وکار و درک نیازهای مشتری نیز بسیار مهم است. به‌روز بودن با ابزارهای جدید و یادگیری مداوم نیز از ویژگی‌های ضروری متخصصان این حوزه است.

علم داده چه نقشی در هوش مصنوعی و یادگیری ماشین دارد؟

عابدی با تاکید بر اینکه علم داده و هوش مصنوعی به‌طور نزدیکی با هم در ارتباط هستند، اظهار کرد: داده‌ها به‌عنوان «سوخت اصلی» سیستم‌های هوش مصنوعی و یادگیری ماشین عمل می‌کنند. با استفاده از تحلیل‌های علم داده، مدل‌های یادگیری ماشین بهبود می‌یابند و توانایی پیش‌بینی و تصمیم‌گیری این مدل‌ها ارتقاء پیدا می‌کند. علم داده با استفاده از الگوریتم‌های یادگیری ماشین به تحلیل داده‌های پیچیده و بزرگ کمک می‌کند و هوش مصنوعی با استفاده از این مدل‌ها به تصمیم‌گیری‌های خودکار می‌پردازد.

وی افزود: برای اینکه یک مدل هوش مصنوعی توسعه یابد، باید توسط داده‌ها آموزش داده شود و داده‌هایی که برای آموزش این مدل نیاز هستند، باید توسط متخصصان علم داده جمع‌آوری و پالایش شوند. همچنین، بهترین الگوریتم برای اجرای مدل باید انتخاب شود. در نهایت، یک سیستم مبتنی بر هوش مصنوعی با استفاده از این داده‌ها و الگوریتم به نتیجه و پاسخ خواهد رسید. از این رو مراحل علم داده به این شرح است:

جمع‌آوری داده:  داده‌ها از منابع مختلف جمع‌آوری می‌شوند و شامل داده‌های ساختاریافته و غیرساختاریافته هستند.

پالایش و پیش‌پردازش داده: داده‌های جمع‌آوری شده باید پاک‌سازی و پردازش شوند تا کیفیت و دقت آنها افزایش یابد. این مرحله شامل حذف داده‌های نادرست، پر کردن داده‌های مفقود و تبدیل فرمت‌های داده است.

تحلیل اکتشافی داده (EDA): در این مرحله، داده‌ها بررسی و تحلیل می‌شوند تا الگوها و روابط موجود در آنها شناسایی شوند.

انتخاب ویژگی: انتخاب ویژگی‌های مهم و تأثیرگذار بر روی مدل به بهبود دقت و کارایی آن کمک می‌کند.

ساخت و آموزش مدل: الگوریتم‌های یادگیری ماشین، انتخاب و مدل ساخته می‌شود. سپس مدل با استفاده از داده‌های آموزشی آموزش داده می‌شود.

ارزیابی مدل: مدل آموزش دیده با استفاده از داده‌های آزمون ارزیابی می‌شود تا دقت و قابلیت پیش‌بینی آن مشخص شود.

استقرار مدل: مدل نهایی در محیط عملیاتی مستقر می‌شود و آماده استفاده در فرآیندهای تصمیم‌گیری است.

نظارت و به‌روزرسانی: مدل به‌طور مداوم نظارت و به‌روزرسانی می‌شود تا عملکرد آن حفظ شود و با تغییرات داده‌ها سازگار باشد.

وی یادآور شد: تقریبا می‌توان گفت علم داده در تمام صنایع قابل استفاده است، از جمله در حوزه‌های مالی، بهداشت و درمان، تجارت الکترونیک و حمل‌ونقل. در صنعت مالی، علم داده به تحلیل ریسک، پیش‌بینی بازار و کشف تقلب کمک می‌کند. در حوزه بهداشت، از داده‌ها برای پیش‌بینی بیماری‌ها، تحلیل نتایج درمان و بهینه‌سازی عملیات بیمارستانی استفاده می‌شود. تجارت الکترونیک نیز از علم داده برای تحلیل رفتار مشتری، سفارشی‌سازی پیشنهادات و بهبود تجربه کاربر بهره می‌برد. صنعت حمل‌ونقل از داده‌های بزرگ برای بهینه‌سازی مسیرها و مدیریت ترافیک استفاده می‌کند و البته هر روز به دامنه این صنایع و کاربردهای آن افزوده می‌شود.

مدیریت مسائل اخلاقی مرتبط با علم داده

این تحلیلگر حوزه هوش مصنوعی، حفظ حریم خصوصی و عدالت الگوریتم‌ها را دو چالش مهم در علم داده عنوان کرد و گفت: به دلیل حجم عظیم داده‌های شخصی که توسط شرکت‌ها جمع‌آوری می‌شود، حفظ حریم خصوصی افراد بسیار مهم است. همچنین، عدالت در الگوریتم‌ها به این معناست که مدل‌های یادگیری ماشین باید از تبعیض جلوگیری کنند و بر اساس داده‌های مغرضانه تصمیم نگیرند. برای مدیریت این چالش‌ها، لازم است که قوانین و مقررات سخت‌گیرانه‌تری وضع شود و شفافیت در فرایندهای علم داده افزایش یابد و البته نکته بسیار مهمی که وجود دارد، این است که کشورها و شرکت‌های پیشرو در زمینه علم داده و پردازش‌ها و آنهایی که داده‌های عظیم در اختیار دارند، نقش مهمی را در آینده این علم و مسیری که می‌تواند طی کند، خواهند داشت.

به گفته وی، چالش‌های اصلی توسعه علم داده در ایران را می‌توان در چندین حوزه کلیدی دسته‌بندی کرد که شامل زیرساخت‌های تکنولوژیک، منابع انسانی، فرهنگ سازمانی و چالش‌های قانونی و اخلاقی می‌شود. اما در کنار این چالش‌ها، فرصت‌های بسیار بزرگی نیز وجود دارد که در صورت مدیریت صحیح، می‌توانند به تحول دیجیتال و بهبود تصمیم‌گیری هوشمند در سازمان‌های ایرانی منجر شوند. از دیگر  چالش‌های علم داده در کشور می‌توان به این موارد اشاره کرد:

۱. کمبود زیرساخت‌های تکنولوژیک

یکی از چالش‌های مهم در مسیر توسعه علم داده در ایران، ضعف زیرساخت‌های فناوری اطلاعات و ارتباطات (ICT) است. برای پردازش و مدیریت حجم عظیمی از داده‌ها، نیاز به زیرساخت‌های پیشرفته‌ای همچون سرورها، سیستم‌های ابری و پلتفرم‌های ذخیره‌سازی داده بزرگ (Big Data) وجود دارد. در ایران، محدودیت‌های موجود در این زمینه، به‌ویژه در استفاده از خدمات ابری جهانی و محدودیت‌های پهنای باند، می‌تواند سرعت پیشرفت این حوزه را کند کند.

۲. کمبود نیروی انسانی متخصص

علم داده به عنوان یک رشته چندمنظوره نیازمند نیروی انسانی با تخصص‌های مختلف از جمله برنامه‌نویسی، آمار، یادگیری ماشین و تحلیل کسب‌وکار است. در ایران، کمبود نیروی متخصص و نبود دوره‌های آموزشی پیشرفته و کاربردی یکی از موانع اصلی است. بسیاری از دانشگاه‌ها هنوز برنامه‌های آموزشی مناسبی برای تربیت متخصصان علم داده ندارند و تنها به جنبه‌های تئوریک می‌پردازند.

۳. فرهنگ سازمانی و مقاومت در برابر تغییر

یکی دیگر از چالش‌های بزرگ، عدم تمایل برخی سازمان‌ها به پذیرش فرهنگ داده‌محور است. بسیاری از سازمان‌های کشور هنوز تصمیم‌گیری‌های خود را بر اساس تجربیات گذشته و روش‌های سنتی انجام می‌دهند و به جای استفاده از داده‌ها و مدل‌های پیش‌بینی، به عوامل دیگری اعتماد می‌کنند.

۴. مسائل قانونی و اخلاقی

یکی از موضوعات حساس در علم داده، حفظ حریم خصوصی و امنیت داده‌ها است. با توجه به اینکه بسیاری از داده‌ها در ایران به‌صورت غیرساختاریافته و بدون نظارت دقیق جمع‌آوری می‌شوند، نگرانی‌های زیادی در مورد سوءاستفاده از داده‌ها و نقض حریم خصوصی افراد وجود دارد.

عابدی اصل خاطر نشان کرد: در کل اگر بخواهیم یک جمع بندی داشته باشیم، علم داده به عنوان یکی از مهم‌ترین حوزه‌های فناوری در دنیای امروز، نقشی کلیدی در پیشرفت‌های فناوری و تصمیم‌گیری‌های هوشمند دارد. این حوزه با ترکیب تحلیل‌های پیچیده داده و ابزارهای پیشرفته، به سازمان‌ها کمک می‌کند تا از داده‌های خود بهترین بهره را ببرند. آینده علم داده با توجه به پیشرفت‌های هوش مصنوعی و یادگیری ماشین بسیار روشن است و انتظار می‌رود که تاثیر آن بر صنایع و زندگی روزمره ما بیشتر از گذشته شود.

  • منبع خبر : ایسنا