همانطور که سازمانها بزرگ میشوند، اطلاعات مرتبط با آنها نیز به صورت تصاعدی رشد مینماید و به تبع پیچیدگیهای مرتبط با دادهها افزایش مییابد. بسیاری از سازمانهای بزرگ در برنامههای کاربردی متفاوتشان دادههای زیادی در فرمتهای مختلفی را دارند. به همان میزان که دادهها گسترش مییابند، دستهبندی آنها با یک الگوریتم یا منطق مشخص بسیار دشوار میگردد. سازمانهای بزرگ در واقع با این چالش مواجه هستند که تمامی اطلاعات را در یک پلتفرم نگهداری نمایند و یک دیدگاه ثابت به آنها داشته باشند. این چالش منحصر به فرد برای درک تمامی دادههایی که از منابع متفاوت به دست میآیند و استخراج اطلاعات علمی مفید از آنها، انقلاب Big Data جهانی نامیده می شود.
قابلیت گسترش سیستمهای اطلاعاتی و سایر سیستمهایی که به محاسبات وابسته اند، به خوبی توسط قانون مور نشان داده می شود. گُردن مور از موسسین شرکت اینتل در سال 1965 پیشبینی کرد که تعداد قطعات یا اجزائی که در مدارهای مجتمع مورد استفاده قرار میگیرند، هر سال دو برابر میشود. در طول پنجاه سال گذشته، رشدی که در واقع نمایی بود، با سرعت بسیار کمی کندتر شد. به عنوان نمونه، تعداد ترانزیستورها در مدارهای مجتمع، هر سال دو برابر گردید. ظرفیت دیسک، عملکرد کامپیوترها در واحد هزینه و غیره نیز به همین ترتیب، با سرعت مشابه در حال رشد هستند. در کنار این پیشرفتهای فوقالعاده در فنآوری، مردم و سازمانها بیش از پیش به دستگاههای کامپیوتری و منابع اطلاعاتی بر روی اینترنت وابسته میشوند.
امروزه، Big Data به یکی از مباحثی تبدیل شده است که در روند توسعه تکنولوژی بسیار به آن پرداخته میشود. در حقیقت چالش واقعی با سازمانهای بزرگ دریافت حداکثر اطلاعاتی است که در حال حاضر در دسترس است و همچنین پیشبینی این موضوع که چه نوعی از دادهها در آینده جمعآوری میشود. در واقع چگونه میتوان به اطلاعات موجود، دست یافت و به آن معنا بخشید و به علاوه دستیابی به بینش دقیقی در مورد دادههای گذشته یکی از نقاط کلیدی در بحثهایی است که در بسیاری از جلسات اجرایی در سازمانها مورد انتظار است. با انفجار دادهها، Big Data به یک واقعیت در بسیاری از سازمانها تبدیل شده است.
تعریف Big Data :
سه واژه هستند که کلان داده (Big Data) را تعریف میکنند: Variety (تنوع)،Velocity (سرعت) و Volume (حجم) که در اصطلاح عامیانه به آن ها 3V گفته میشود.
Volume (حجم):
ما در دنیای حاضر شاهد رشد نمایی ذخیره دادهها هستیم. ما میتوانیم در این ذخیرهسازی انواع متفاوتی از دادهها نظیر ویدئو، موسیقی، تصاویر بزرگ را در شبکههای اجتماعی مشاهده کنیم. سیستمهای ذخیرهسازی با حجم ترابایت یا پتابایت در سازمانها بسیار معمول هستند. همان طور که پایگاه داده رشد میکند، برنامههای کاربردی و معماری ساخته شده برای حمایت از دادهها نیز نیاز به بررسی مجدد دارند. گاهی اوقات دادههای مشابه از زوایای گوناگون بایستی مورد بررسی قرار بگیرد. حجم زیاد دادهها نشاندهنده Big Data است.
Velocity (سرعت):
رشد دادهها و انفجار رسانههای اجتماعی، نگاه ما را به دادهها تغییر داده است. زمانی رسیده است که ما به عنوان استفادهکننده از داده، به این باور رسیدهایم که دادههای دیروز دادههای گذشته هستند. کانالهای رادیویی و شبکههای خبری به شدت دچار تغییر شدهاند چرا که به سرعت اخبار را در اختیار ما قرار میدهند. امروزه مردم در شبکههای اجتماعی آخرین رخدادها را برای استفاده دیگران به روز رسانی میکنند. در شبکههای اجتماعی گاهی گذشت چند ثانیه منجر به قدیمی شدن یک پیغام میشود که دیگر مورد علاقه کاربران نیست. مردم اغلب پیامهای قدیمی را دور ریخته و به موارد جدید علاقه و توجه نشان میدهند. این داده با سرعت بالا نشاندهنده Big Data است.
Variety (تنوع):
اطلاعات را میتوان در فرمتهای متعدد ذخیره نمود. به عنوان نمونه پایگاه داده، اکسل، اکسس یا حتی یک فایل متنی ساده را به کار برد. گاهی اوقات دادهها در فرمتهای سنتی قرار نمیگیرند بلکه به شکل ویدئو، پیام کوتاه، فایل PDF و … هستند. سازمانها نیاز به این دارند که دادهها را سازماندهی نمایند و آنها را در قالب معناداری قرار دهند. اگر تمامی دادهها دارای یک فرمت باشند کار بسیار ساده است اما این محدودیت در واقعیت وجود ندارد. جهان واقعی دارای دادههای زیادی در فرمتهای متفاوتی است و چالش اصلی رویارویی با این تنوع دادههاست. تنوع دادهها نشاندهنده Big Data است.
لازم به ذکر است، Big Data تنها به معنای تعداد زیاد دادهها نیست، در واقع مفهومی است که فرصتی را فراهم آورده است تا به دادههای موجود در محیط پیرامون دیدی جدید پیدا کنیم.
ترجمه و گردآوری: تیم مدیریت محتوای رایورز
سوالی دارید از ما بپرسید
تلفن: 89326444-021
آنچه در این مقاله میخوانید