معرفی علم داده ها درVisual Studio

یکشنبه 17 بهمن 1395

علم اطلاعات (Data Science) به مفهوم جمع آوری داده ها از منابع مختلف و تبدیل داده به دانش تصمیم گیری می باشد که شما می توانید درساختار توسعه پروژه های علمی داده های خود از آن استفاده نمایید.

معرفی علم داده ها درVisual Studio

علم اطلاعات چیست؟

به سادگی می توان گفت: به جمع آوری داده ها از منابع مختلف و تبدیل داده ها را به دانش تصمیم گیری علم اطلاعات میگویند. این سیستم دارای خواصی مانند می باشد :

توانایی دسترسی 

برقراری ارتباط

روند

تجسم

تحلیل و بررسی

پیش بینی

اجزای اصلی یکپارچه موجود در علم داده در شکل زیر نمایش داده شده است.

ابزار مورد استفاده برای علم اطلاعات

اسامی برخی از ابزار بزرگ  که ما برای علم اطلاعات استفاده میکنیم :

R

SQL

Python

Hadoop

SAS

Java

Hive

Matlab

Pig

C++

Ruby

SPSS

Perl

Tableau

Excel

NoSQL

AWS

C

HBase

Bash

Spark

ElasticSearch

PHP

Scala

Shark

awk

Cascading

Cassandra

Clojure

Fortran

JavaScript

JMP

Mahout

objective-C

QlickView

Redis

Redshift

Sed

روند ابزار علم داده :

روند چرخه زندگی علم اطلاعات

روند تیم اطلاعات علمی (TDSP) برای چرخه زندگی توصیه می شود که شما می توانید درساختار توسعه پروژه های علمی داده های خود، از آن استفاده کنید.این فرایند پنج مرحله عمده است.

درک کسب و کار

اکتساب داده ها و درک

مدلسازی

گسترش

پذیرش مشتری

فراگیری ماشین

یادگیری ماشین یکی از تکنیک های عمده مورد استفاده در علم داده است. در واقع، روند کار آن مانند تجزیه و تحلیل داده های فعلی است، و بر اساس آن، پیش بینی رفتارهای آینده، نتایج، و روند انجام میشود.این کمک می کند تا در ساخت سیستم شما هوشمندانه عمل کند.

تجزیه و تحلیل پیش بینی شده

تجزیه و تحلیل پیش بینی یک روش مهم مورد استفاده در علم داده است. برای پیش بینی تجزیه و تحلیل، ما با استفاده از الگوریتم های داده های موجود به پیش بینی حوادث آینده میپردازیم.

علم داده در ویژوال استودیو

مایکروسافت شامل برخی از ابزار علم داده در ویژوال استودیو، و همچنین برخی از پیشرفت ها به تازگی در ویژوال استودیو 2017 RC  منتشر شده است.

نسخه جدید شامل حجم کار خاص برای اقلام علم اطلاعات

1.ذخیره سازی داده ها و پردازش

2.علم اطلاعات و برنامه های کاربردی تحلیلی

ذخیره سازی داده ها و پردازش

در این حجم کار، ما باید از ابزارهای پیشرفته برای ذخیره سازی داده های بزرگ و تجزیه و تحلیل پیشرفته استفاده کنیم

SQL

Hadoop

Spark

یادگیری ماشین با Azure

علم اطلاعات و برنامه های کاربردی تحلیلی

ابزارهای پایتون

ابزارهای R

F #

ابزارهای پایتون و ابزارهای R

این دو ابزار در علم اطلاعات از رتبه بندی بسیار بالایی برخوردار هستند.

برنامه نویسان

نویسنده 3355 مقاله در برنامه نویسان

کاربرانی که از نویسنده این مقاله تشکر کرده اند

در صورتی که در رابطه با این مقاله سوالی دارید، در تاپیک های انجمن مطرح کنید