کلاندادهها تحلیلهای جدید را موجب خواهند شد. زیرا به نظر میرسد که «سرعت» و «جامعیت»، نقش پررنگی نسبت به «حجم عظیم» را در این نوع از اطلاعات ایفا میکند اصطلاح کلانداده، اولین بار در دهه ۱۹۹۰ مطرح شد و به مجموعههایی عظیم از اطلاعات قابل اشاره داشت که قابلیت تجزیه و تحلیل دارد. در تعریف […]
کلاندادهها تحلیلهای جدید را موجب خواهند شد. زیرا به نظر میرسد که «سرعت» و «جامعیت»، نقش پررنگی نسبت به «حجم عظیم» را در این نوع از اطلاعات ایفا میکند
اصطلاح کلانداده، اولین بار در دهه ۱۹۹۰ مطرح شد و به مجموعههایی عظیم از اطلاعات قابل اشاره داشت که قابلیت تجزیه و تحلیل دارد. در تعریف کلانداده به حجم عظیمی اطلاعات اشاره میشود که با سرعت بالا در یک زمان قابل دریافت است. با این حال، «جامعیت اطلاعات»، «وضوح و قابلیت شناسایی اطلاعات»، «اتصال دادههای مرتبط»، «انعطافپذیری»، «انطباقپذیری» و «مقیاسپذیری» از دیگر ویژگیهایی است که برای کلاندادهها ذکر میشود.
این دادهها در حوزههای مختلف وجود دارد. از دادههایی که سیستمهای ذخیرهسازی اطلاعات ابری و شبکههای اجتماعی از ذائقه افراد جامعه در اختیار دارند تا دادههای بازارهای مالی و خصوصیات جغرافیایی. خلاصه اینکه دادههای بسیار کلانی با توجه به پیشرفت و همگراییهای جدید در زمینه رایانهها به وجود آمده است. این دادهها در کنار یکدیگر، منبع عظیمی برای تحقیقات فرهنگی و اجتماعی فراهم میکند و حتی گزاف نیست که بگوییم که کلاندادهها را میتوان انقلابی در این زمینه تلقی کرد. به تحقیق میتوان گفت که این دادهها، از دادههای پیشین در تحقیقات علوم اجتماعی متفاوت است و منجر به ایجاد پارادایمهای جدید پژوهشی در این حوزه خواهد شد. شاید حتی بتوان گفت که کلاندادهها، نوع جدیدی از علوم اجتماعی را رقم خواهد زد.
کلاندادهها تحلیلهای جدید را موجب خواهند شد. زیرا به نظر میرسد که «سرعت» و «جامعیت»، نقش پررنگی نسبت به «حجم عظیم» را در این نوع از اطلاعات ایفا میکند. به عنوان یک پژوهشگر اجتماعی فکر کنید که قصد انجام پژوهشی پیمایشی را دارید. برای دستیابی به اطلاعاتی محدود و همراه با «نمونهگیری» چه رنجهایی که در پیش روی پژوهشگر وجود دارد. حتی فراتر از آن، طرحهای ملی مانند سرشماری که هر ۵ سال یکبار انجام میگیرد را در نظر آورید. آیا اطلاعاتی که از این پژوهشها بهدست میآید جامعیت کلاندادهها را دارد؟ آیا با همان سرعتی که کلاندادهها را میتوان در اختیار داشت میتوان اطلاعات مورد نیاز را با پیمایشهای اجتماعی، نظرسنجیها و سرشماری به دست آورد؟ قطعاً پاسخ منفی است. کلاندادهها با سرعت و جامعیتی که دارند، عملاً جایگزین مناسبی برای روشهای سنتیتر پژوهشهای اجتماعی محسوب میشوند. همچنین ویژگیهای دیگر کلاندادهها را در قیاس با پژوهشهای پیشین در علوم اجتماعی در نظر بگیرید. سؤالات بسته پرسشنامهها، هرگز انعطاف اطلاعات موجود در کلاندادهها را ندارند و کلاندادهها، بدون «دخالت نظرات شخصی پژوهشگران» در اختیار پژوهش قرار میگیرد و کمترین «کنترل» وجود دارد. مسئله دیگر، بهای کمتری است که در کلاندادهها برای اطلاعات میپردازیم. قطعاً این اطلاعات، ارزانتر از پژوهشهای سنتیتر دستیابی به اطلاعات است.
همچنین باید در نظر داشت که گستره اطلاعات، اصلاً قابل مقایسه با گذشته نیست. این اطلاعات، از دستگاههای متعدد و مجموعههای زیادی، جمعآوری میشود. رایانهها، تلفنهای هوشمند و لنز دوربینها، مهمترین دستگاههای جمعآوری اطلاعات است که از طریق پلتفرم رسانههای اجتماعی عمل میکنند. همچنین به لحاظ موضوعی، کلاندادهها، موضوعات مختلفی از سلامت، آموزش، مهارت، اقتصاد، سبک زندگی و … را شامل میشود که البته این موضوعات در ارتباط با یکدیگر ارائه میشوند. شاید بیارتباط به نظر برسد، اما کلاندادهها، بهواسطه برنامههای خرید بلیت یا درخواست تاکسی و هتل و …، اطلاعات ذیقیمتی از مسافرت درونشهری و برونشهری افراد، هزینههای سفر و علائق گردشگری آنان دارند.
این دادهها به صورت منظم و پیوسته، به موقع به دست پژوهشگران میرسد و همچنین قابلیت ردیابی در طول زمان را دارد. ضمن اینکه بهراحتی میتواند به صورت نمودار، روندها و فرایندها را نشان دهد و یک وضعیت و یا مسئلهای خاص را در مقایسه با وضعیت یا مسئلهای دیگر بررسی کند. بنابراین قدرت پیشبینی و سیاستگذاری را نیز افزایش میدهد. البته چالشی اساسی در دادهکاوی وجود دارد و آن هم روشهای تحلیل اطلاعات است. زیرا شاید الگوریتمهای محاسباتی نتواند از عهده تحلیل اطلاعات برآید و یا اساساً در تعریف عملیاتی مفاهیم اجتماعی و فرهنگی و فرضیههای آن دچار خطا گردد. در این زمینه میتوان گفت که تحلیلهای جدید مبتنی بر کلاندادهها به علت عدم وجود مفروضات سخت و نمونهگیری، اعتبار زیادی دارد و با افت کیفیت دادهها مقابله میکند. ضمن اینکه کلاندادهها میتوانند همزمان الگوهای ذهنی و سؤالات احتمالی را مطرح و پاسخ دهند، برخلاف دادههای سنتی که به یک سؤال خاص پاسخ میدادند. همچنین وجود حجم عظیم از اطلاعات این امکان را میدهد که از میان الگوریتمهای مختلف، بهترین مدل را برای توضیح پدیدهها به کار برد و قاعدتاً سیستمهای پردازش اطلاعات در این زمینه محدودیتی ندارند.