نشریه‌ی الکترونیکی رایانا

گروه کامپیوتر دبیرستان علامه حلی یک تهران (دوره اول)

نشریه‌ی الکترونیکی رایانا

گروه کامپیوتر دبیرستان علامه حلی یک تهران (دوره اول)

نشریه‌ی الکترونیکی رایانا

این وبلاگ تحت مدیریت گروه و انجمن علمی کامپیوتر دبیرستان علامه حلی یک (دوره اول) است.

آخرین نظرات
  • ۱۳ مهر ۹۹، ۱۹:۱۲ - mmvg02 mm
    The Last
  • ۶ مهر ۹۹، ۱۰:۴۶ - فائزه
    ممنون

علم داده و پایتون

دوشنبه, ۷ مرداد ۱۳۹۸، ۱۱:۵۴ ق.ظ

بنا به عقیده ی بسیاری از صاحب نظران، علم داده جذاب ترین و پر کاربرد ترین علم قرن بیست و یکم است.در جهان امروزی که تکنولوژی و فناوری حرف اول را در آن میزند، همه سوال هایی دارند که تنها راه پاسخ دادن به آنها بررسی دقیق و کامل حجم قابل توجهی از داده ها خواهد بود. از سازمان ها و شرکت ها کوچک گرفته تا موسسه ها ی دولتی و بزرگ همه داده های نامحدودی در اختیار دارند که با دسته‌بندی، تفسیر و به‌کار گرفتن آن‌ها، می‌توان مقاصد گوناگونی را برآورده کرد و البته این کار ساده نیست و می‌تواند چالش‌برانگیز باشد. اینجا است که پای علم داده و تخصص در آن به میان می‌آید. علم داده چیست و چگونه می‌توان دانشمند داده شد؟ این سؤالی است که در ادامهٔ مقاله جوابی برایش خواهیم یافت.

 

·       علم داده چیست؟

اساس علم داده یا دیتا ساینس به انگلیسی(Data Science) متشکل از نظریه‌ها و مباحث مرتبط با چند رشتهٔ علمی مختلف است که در آن، با استفاده از روش‌های علمی، الگوریتم‌ها، فرایندها و سامانه‌های مختلف سعی می‌شود تا از داده‌های ذخیره‌شدهٔ سازمان‌ها و مؤسسه‌ها به مقاصد مختلف بهره‌برداری بشود. دانشمند داده باید در زمینه‌ها مختلفی مهارت داشته باشد که مهم‌ترین آن‌ها مفاهیم آماری، علوم کامپیوتری و دانش مرتبط با دنیای کسب‌وکار است. کار اصلی دانشمند داده تجزیه‌وتحلیل داده‌هایی است که در بانک‌های اطلاعاتی سازمان‌ها و مؤسسه‌ها ذخیره‌سازی شده‌اند. داده‌هایی که از اینترنت، گوشی‌های هوشمند، مشتری‌ها و … گردآوری شده‌اند.

در علم داده سعی بر آن است تا با واکاوی و تجزیه ‌وتحلیل داده‌ها، اطلاعات ارزشمندی در اختیار مسئولان سازمان‌ها قرار داده بشود تا با استفاده از آن، بتوانند با نوآوری بیشتری خدمات خود را ارائه یا محصولات‌شان را تولید کنند و به‌دنبال آن، بازخورد بهتری دریافت کنند. داده‌های سازمان در این فرایند نقش کلیدی دارند، اما مهم‌تر از آن اطلاعاتی است که با تخصص و مهارت دانشمند داده حاصل می‌شود و فعالیت‌های آتی سازمان، بر اساس آن برنامه‌ریزی می‌شوند.

·       یک دانشمند داده چه می کند؟

وظیفهٔ اصلی دانشمند داده استخراج معانی مختلف و کاربردی از انواع داده است (ساختار‌یافته، نیمه‌ساختاریافته، ساختارنیافته). داده‌ای که به‌طور بی‌وقفه وارد بانک‌های اطلاعاتی سازمان می‌شود. استخراج داده از بانک‌های اطلاعاتی، فراهم کردن داده برای تجزیه‌وتحلیل‌های گوناگون، طراحی و ساخت مدل‌های آماری و تألیف گزارش‌هایی به زبان ساده و قابل‌فهم از داده‌های مصورسازی شده (گزارش‌هایی که در اختیار مسئولان سازمان قرار می‌گیرد)، از مهم‌ترین وظایف دانشمند داده هستند.

در ادامه می‌توانید سایر وظایف دانشمند داده را مشاهده کنید:

1.   گردآوری داده

2.   آماده‌سازی داده؛

3.   تجزیه‌وتحلیل داده‌های اکتشافی

4.   ارزیابی و تفسیر نتایج حاصل‌شده از تجزیه‌وتحلیل داده‌های اکتشافی؛

5.   طراحی و ساخت مدل‌های آماری؛

6.   امتحان کردن و گسترش این مدل‌ها؛

7.   بهینه‌سازی مدل‌ها.

 

·       حالا یک دانشمند داده چطور این کارها را انجام میدهد؟

دانشمند داده باید در چند  زمینه ی مختلف مانند آمار، مهارت های کامپیوتری برای حل کردن مسائل پیچیده ، ریاضیات و... مهارت کامل داشته باشد او در کنار این دانش ها نیاز به ابزاری دارد که آن ابزار ها برای کنکاش در میان داده ها به او کمک کنند یکی از بهترین ابزار ها در این زمینه زبان برنامه نویسی پایتون است که یک دانشمند داده میتواند توسط آن در میان حجم زیادی از داده ها تحقیق کند.

·       چرا پایتون؟

با وجود چندین زبان دیگر مانند جاوا،آر و... پایتون یکی از بهترین گزینه ها برای یادگیری و به کار گیری آن در علم داده است

برخی از دلایل برتری پایتون برای کنکاش در علم داده:

1.   متن‌باز بودن و نصب رایگان.

2.   جامعه آنلاین فوق‌العاده.

3.   یادگیری بسیار آسان.

4.   قابلیت تبدیل شدن به یک زبان متداول برای علم داده و تولید محصولات تحلیلی مبتنی بر وب.

 

البته پایتون در کنار مزایا، معایبی نیز دارد که مهم‌ترین آن‌ها در ادمه بیان شده است.

1.پایتون یک «زبان تفسیری»Interpreted Language) )است ، (زبان «کامپایلی» (compiled language) نیست)، از این رو ممکن است نسبت به یک زبان کامپایلی مدت زمان بیشتری CPU استفاده کند. با این وجود به دلیل صرفه‌جویی که در زمان برنامه‌نویس‌ها دارد (به دلیل سهولت استفاده)، همچنان یک انتخاب خوب است.

به هر حال پایتون با کتابخانه هایی نظیر Pandas به بخشی جدایی ناپذیر از علم داده تبدیل شده و اکنون یکی از معیار های دانشمند داده خوب تسلط کامل به پایتون است.

·       حرف آخر.

اگر شما نیز به علم داده و داده کاوی علاقه دارید کار خود را با یاد گیری  کتابخانه ی Pandas شروع کنید البته این کار خیلی آسان هم نخواهد بود و به جز یادگیری پایتون باید در بسیاری از دانش های دیگر مهارت کافی داشته باشید.

 


  • ۹۸/۰۵/۰۷
  • علی صادق‌طبقی

علم داده

پایتون

کامپیوتر

نظرات (۰)

هیچ نظری هنوز ثبت نشده است
ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی