کلان داده (‌Big Data)

همان‌طور که سازمان‌ها بزرگ می‌شوند، اطلاعات مرتبط با آن‌ها نیز به صورت تصاعدی رشد می‌نماید و به تبع پیچیدگی‌های مرتبط با داده‌ها افزایش می‌یابد. بسیاری از سازمان‌های بزرگ در برنامه‌های کاربردی متفاوتشان داده‌های زیادی در فرمت‌های مختلفی را دارند. به همان میزان که داده‌ها گسترش می‌یابند، دسته‌بندی آن‌ها با یک الگوریتم یا منطق مشخص بسیار دشوار می‌گردد. سازمان‌های بزرگ در واقع با این چالش مواجه هستند که تمامی اطلاعات را در یک پلتفرم نگهداری نمایند و یک دیدگاه ثابت به آن‌ها داشته باشند. این چالش منحصر به فرد برای درک تمامی داده‌هایی که از منابع متفاوت به دست می‌آیند و استخراج اطلاعات علمی مفید از آن‌ها، انقلاب Big Data جهانی نامیده می شود.

قابلیت گسترش سیستم‌های اطلاعاتی و سایر سیستم‌هایی که به محاسبات وابسته اند، به خوبی توسط قانون مور نشان داده می شود. گُردن مور از موسسین شرکت اینتل در سال 1965 پیش‌بینی کرد که تعداد قطعات یا اجزائی که در مدارهای مجتمع مورد استفاده قرار می‌گیرند، هر سال دو برابر می‌شود. در طول پنجاه سال گذشته، رشدی که در واقع نمایی بود، با سرعت بسیار کمی کندتر شد. به عنوان نمونه، تعداد ترانزیستورها در مدارهای مجتمع، هر سال دو برابر گردید. ظرفیت دیسک، عملکرد کامپیوترها در واحد هزینه و غیره نیز به همین ترتیب، با سرعت مشابه در حال رشد هستند. در کنار این پیشرفت‌های فوق‌العاده در فن‌آوری، مردم و سازمان‌ها بیش از پیش به دستگاه‌های کامپیوتری و منابع اطلاعاتی بر روی اینترنت وابسته می‌شوند.

امروزه، Big Data  به یکی از مباحثی تبدیل شده است که در روند توسعه تکنولوژی بسیار به آن پرداخته می‌شود. در حقیقت چالش واقعی با سازمان‌های بزرگ دریافت حداکثر اطلاعاتی است که در حال حاضر در دسترس است و همچنین پیش‌بینی این موضوع که چه نوعی از داده‌ها در آینده جمع‌آوری می‌شود. در واقع چگونه می‌توان به اطلاعات موجود، دست یافت و به آن معنا بخشید و به علاوه دستیابی به بینش دقیقی در مورد داده‌های گذشته یکی از نقاط کلیدی در بحث‌هایی است که در بسیاری از جلسات اجرایی در سازمان‌ها مورد انتظار است. با انفجار داده‌ها، Big Data  به یک واقعیت در بسیاری از سازمان‌ها تبدیل شده است.

تعریف Big Data :

سه واژه هستند که کلان داده (Big Data) را تعریف می‌کنند: Variety (تنوع)،Velocity  (سرعت) و Volume  (حجم) که در اصطلاح عامیانه به آن ها 3V  گفته می‌شود.

Volume  (حجم):

ما در دنیای حاضر شاهد رشد نمایی ذخیره داده‌ها هستیم. ما می‌توانیم در این ذخیره‌سازی انواع متفاوتی از داده‌ها نظیر ویدئو، موسیقی، تصاویر بزرگ را در شبکه‌های اجتماعی مشاهده کنیم. سیستم‌های ذخیره‌سازی با حجم ترابایت یا پتابایت در سازمان‌ها بسیار معمول هستند. همان طور که پایگاه داده رشد می‌کند، برنامه‌های کاربردی و معماری ساخته شده برای حمایت از داده‌ها نیز نیاز به بررسی مجدد دارند. گاهی اوقات داده‌های مشابه از زوایای گوناگون بایستی مورد بررسی قرار بگیرد. حجم زیاد داده‌ها نشان‌دهنده  Big Data است.


Velocity (سرعت):

رشد داده‌ها و انفجار رسانه‌های اجتماعی، نگاه ما را به داده‌ها تغییر داده است. زمانی رسیده است که ما به عنوان استفاده‌کننده از داده، به این باور رسیده‌ایم که داده‌های دیروز داده‌های گذشته هستند. کانال‌های رادیویی و شبکه‌های خبری به شدت دچار تغییر شده‌اند چرا که به سرعت اخبار را در اختیار ما قرار می‌دهند. امروزه مردم در شبکه‌های اجتماعی آخرین رخدادها را برای استفاده دیگران به روز رسانی می‌کنند. در شبکه‌های اجتماعی گاهی گذشت چند ثانیه منجر به قدیمی شدن یک پیغام می‌شود که دیگر مورد علاقه کاربران نیست. مردم اغلب پیام‌های قدیمی را دور ریخته و به موارد جدید علاقه و توجه نشان می‌دهند. این داده با سرعت بالا نشان‌دهنده  Big Data است.


Variety (تنوع):

اطلاعات را می‌توان در فرمت‌های متعدد ذخیره نمود. به عنوان نمونه پایگاه داده، اکسل، اکسس یا حتی یک فایل متنی ساده را به کار برد. گاهی اوقات داده‌ها در فرمت‌های سنتی قرار نمی‌گیرند بلکه به شکل ویدئو، پیام کوتاه، فایل PDF و … هستند. سازمان‌ها نیاز به این دارند که داده‌ها را سازماندهی نمایند و آن‌ها را در قالب معناداری قرار دهند. اگر تمامی داده‌ها دارای یک فرمت باشند کار بسیار ساده است اما این محدودیت در واقعیت وجود ندارد. جهان واقعی دارای داده‌های زیادی در فرمت‌های متفاوتی است و چالش اصلی رویارویی با این تنوع داده‌هاست. تنوع داده‌ها  نشان‌دهنده  Big Data است.

لازم به ذکر است، Big Data تنها به معنای تعداد زیاد داده‌ها نیست، در واقع مفهومی است که فرصتی را فراهم آورده است تا به داده‌های موجود در محیط پیرامون دیدی جدید پیدا کنیم.

ترجمه و گردآوری: تیم مدیریت محتوای رایورز

سوالی دارید از ما بپرسید
تلفن: 89326444-021

آنچه در این مقاله میخوانید