ترفند ها و نکته هازبان های برنامه نویسی

۲۰ بسته برتر یادگیری ماشین R در سال ۲۰۲۰

20 بسته برتر آموزش ماشین R در سال 2020

تقریباً همه دانشمندان تازه کار داده و توسعه دهندگان یادگیری ماشین در انتخاب زبان برنامه نویسی دچار اشتباه می شوند. آنها همیشه می پرسند که کدام زبان برنامه نویسی برای یادگیری ماشین و پروژه علوم داده آنها بهترین خواهد بود. یا به دنبال پایتون ، R یا MatLab خواهیم رفت. خوب ، انتخاب یک زبان برنامه نویسی به ترجیح توسعه دهندگان و نیازهای سیستم بستگی دارد. در میان سایر زبان های برنامه نویسی ، R یکی از با پتانسیل ترین و پرتحرک ترین زبان های برنامه نویسی است که دارای چندین بسته یادگیری ماشین R برای هر دو ML ، AI و پروژه های علوم داده است.

در نتیجه ، می توان با استفاده از این بسته های یادگیری ماشین R ، پروژه خود را بدون زحمت و کارآمد توسعه داد. طبق نظرسنجی از Kaggle ، R یکی از محبوب ترین زبانهای یادگیری ماشین منبع باز است.

بهترین بسته های یادگیری ماشین R

R یک زبان منبع باز است تا مردم بتوانند از هر کجای دنیا کمک می کنند تا این منبع باز را توسعه دهند. در کد خود می توانید از جعبه سیاه استفاده کنید که توسط شخص دیگری نوشته شده است. در R ، از این جعبه سیاه به عنوان یک بسته استفاده می شود. این بسته چیزی نیست جز یک کد از پیش نوشته شده است که می تواند به طور مکرر توسط هر کسی استفاده شود. در زیر ، ما ۲۰ بسته برتر یادگیری ماشین R را به نمایش می گذاریم.

۱. CARAT

بسته CARAT به آموزش طبقه بندی و رگرسیون اشاره دارد. وظیفه این بسته CARAT ادغام آموزش و پیش بینی یک مدل است. این یکی از بهترین بسته های R برای یادگیری ماشین و همچنین علم داده است.

این پارامترها را می توان با ادغام چندین کارکرد جستجو کرد تا با استفاده از روش جستجوی شبکه این بسته ، عملکرد کلی یک مدل داده شده محاسبه شود. پس از اتمام موفقیت آمیز همه ی آزمایشات ، سرانجام جستجوی شبکه بهترین ترکیب ها را پیدا می کند.

پس از نصب این بسته ، توسعه دهنده می تواند اسامی (getModelInfo ()) را اجرا کند تا ۲۱۷ عملکرد ممکن را ببیند که تنها با یک عملکرد قابل اجرا هستند. برای ساختن یک مدل پیش بینی ، بسته CARAT از تابع قطار () استفاده می کند. نحو این عملکرد:

(train(formula, data, method

مستندات

۲. randomForest

RandomForest یکی از محبوب ترین بسته های R برای یادگیری ماشین است. این بسته یادگیری ماشین R می تواند برای حل کارهای رگرسیون و طبقه بندی استفاده شود. علاوه بر این ، می توان از آن برای آموزش مقادیر گمشده و خارج استفاده کرد.

این بسته یادگیری ماشین با R به طور کلی برای تولید تعداد زیادی از درختان تصمیم گیری استفاده می شود. در اصل نمونه های تصادفی را می گیرد. و سپس ، مشاهدات در مورد درخت تصمیم گیری داده می شود. سرانجام ، خروجی مشترکی که از درخت تصمیم حاصل می شود ، خروجی نهایی است. نحو این عملکرد:

(=randomForest(formula=, data

مستندات

۳. e1071

این e1071 یکی از پرکاربردترین بسته های R برای یادگیری ماشین است. با استفاده از این بسته ، یک توسعه دهنده می تواند ماشین های بردار پشتیبانی (SVM) ، کوتاهترین محاسبه مسیر ، خوشه بندی بسته بندی شده ، طبقه بندیگر Naive Bayes ، تبدیل کوتاه مدت فوریه ، خوشه بندی فازی و غیره را پیاده سازی کند.

به عنوان نمونه ، برای نحوی SVM داده های IRIS عبارتند از:

svm(Species ~Sepal.Length + Sepal.Width, data=iris)

مستندات

۴. Rpart

Rpart مخفف آموزش پارتیشن بندی بازگشتی و رگرسیون است. این بسته R برای یادگیری ماشین می تواند هر دو کار انجام شود: طبقه بندی و رگرسیون. با استفاده از یک مرحله دو مرحله ای عمل می کند. خروجی یک درخت باینری را مدل می کند. تابع () طرح برای ترسیم نتیجه خروجی استفاده می شود. همچنین ، یک تابع جایگزین ، تابع prp () وجود دارد ، که انعطاف پذیرتر و قدرتمندتر از یک تابع () طرح اصلی است.

تابع rpart () برای ایجاد رابطه بین متغیرهای مستقل و وابسته استفاده می شود. نحو این است:

rpart(formula, data=, method=,control=)

در آنجا که فرمول ترکیبی از متغیرهای مستقل و وابسته است ، داده ها نام مجموعه داده ها هستند ، روش هدف گذاری است و کنترل مورد نیاز سیستم شما است.

مستندات

۵. KernLab

اگر می خواهید پروژه خود را بر اساس الگوریتم های یادگیری ماشین مبتنی بر هسته (core)توسعه دهید ، می توانید از این بسته R برای یادگیری ماشین استفاده کنید. این بسته برای SVM ، تجزیه و تحلیل ویژگی های هسته ، الگوریتم رتبه بندی ، امتیاز اولیه محصول ، فرایند گاوسی و موارد دیگر استفاده می شود. KernLab به طور گسترده ای برای پیاده سازی SVM استفاده می شود.

توابع مختلف هسته در دسترس است. برخی از کارکردهای هسته در اینجا ذکر شده است: polydot (عملکرد هسته چند جمله ای) ، tanhdot (عملکرد هسته مماس مایع بیش از حد) ، laplacedot (عملکرد هسته laplacian) ، و غیره. این توابع برای انجام مشکلات تشخیص الگوی استفاده می شوند. اما کاربران می توانند به جای توابع هسته از پیش تعریف شده از توابع هسته خود استفاده کنند.

مستندات

۶. nnet

اگر می خواهید با استفاده از شبکه عصبی مصنوعی (ANN) برنامه یادگیری دستگاه خود را توسعه دهید ، این بسته nnet ممکن است در این زمینه به شما کمک کند. این یکی از محبوب ترین و آسان برای اجرای بسته های شبکه های عصبی است. اما این یک محدودیت است که این تنها یک لایه گره است.

نحو این بسته عبارت است از:

nnet(formula, data, size)

مستندات

۷. dplyr

یکی از پرکاربردترین بسته های R برای علم داده است. همچنین ، برخی از کارکردهای آسان ، سریع و مداوم را برای دستکاری داده فراهم می کند. هادلی ویکام این بسته برنامه نویسی r را برای علم داده می نویسد. این بسته شامل مجموعه ای از افعال است ، به عنوان مثال ، جهش () ، انتخاب () ، فیلتر () ، خلاصه () و ترتیب ().  << این متن بعدا متناسب با کلمات انگلیسیش قرار بگیرد

برای نصب این بسته ، باید این کد را بنویسید:

install.packages(“dplyr”)

و برای بارگیری این بسته ، باید این نحو را بنویسید:

library(dplyr)

۸. ggplot2

یکی دیگر از ظریف ترین و زیبا ترین بسته های گرافیکی R چارچوب R برای علم داده ggplot2 است. این سیستمی برای ایجاد گرافیک براساس دستور زبان گرافیکی است. نحو نصب این بسته علمی داده ها:

install.packages(“ggplot2”)

۹. Wordcloud

هنگامی که یک تصویر واحد از هزاران کلمه تشکیل شده است ، سپس آن را یک Wordcloud می نامید. در اصل ، تجسم داده های متنی است. این بسته یادگیری ماشینی با استفاده از R برای ایجاد بازنمایی کلمات استفاده می شود و توسعه دهنده می تواند Wordcloud را طبق اولویت خود تنظیم کند ، مانند تنظیم کلمات به صورت تصادفی یا همان کلمات فرکانس در کنار یکدیگر یا کلمات با فرکانس بالا در مرکز و غیره.

 

در زبان یادگیری ماشین R ، دو کتابخانه برای ایجاد wordcloud وجود دارد: Wordcloud و Worldcloud2. در اینجا نحو را برای WordCloud2 نشان خواهیم داد. برای نصب WordCloud2 ، باید بنویسید:

یا می توانید مستقیماً از آن استفاده کنید:

۱. require(devtools)

۲. install_github(“lchiffon/wordcloud2”)

و یا شما به صورت مستقیم می توانید از این دستور استفاده کنید:

library(wordcloud2)

مستندات

۱۰. tidyr

یکی دیگر از بسته های r استفاده شده برای علم داده tidyr است. هدف از این برنامه نویسی برای علم داده ، مرتب سازی داده ها است. در مرتب ، متغیر در ستون قرار می گیرد ، مشاهده در ردیف قرار می گیرد و مقدار در سلول است. این بسته یک روش استاندارد برای مرتب سازی داده ها را توصیف می کند.

برای نصب می توانید از این قطعه کد استفاده کنید:

install.packages(“tidyr”)

برای بارگیری کد

library(tidyr)

مستندات

۱۱. shiny

بسته R ، Shiny یکی از چارچوب های برنامه کاربردی وب برای علم داده است. این امر به ایجاد برنامه های وب با استفاده از زبان R بدون هیچ دشواری و زحمتی کمک می کند. یا توسعه دهنده می تواند نرم افزار را در هر سیستم مشتری یا کابین میزبان یک صفحه وب نصب کند. همچنین ، توسعه دهنده می تواند داشبورد بسازد یا می تواند آنها را در اسناد R Markdown جاسازی کند.

علاوه بر این ، برنامه های Shiny را می توان با زبان های مختلف نویسی مانند ویدجت های html ، مضامین CSS و اقدامات JavaScript گسترش داد. با یک کلام می توان گفت که این پکیج ترکیبی از قدرت محاسباتی R با تعامل وب مدرن است.

مستندات

۱۲. tm

نیازی به گفتن نیست ، متن کاوی امروزه کاربردی نوظهور از یادگیری ماشین است. این بسته یادگیری ماشین R چارچوبی را برای حل وظایف استخراج متن فراهم می کند. در یک برنامه استخراج متن ، یعنی تجزیه و تحلیل احساسات یا طبقه بندی اخبار ، یک توسعه دهنده باید انواع مختلف کارهای خسته کننده ای مانند حذف کلمات ناخواسته و بی ربط ، حذف علائم نگارشی ، حذف کلمات متوقف و موارد دیگر را انجام دهد.

بسته tm شامل چندین کارکرد انعطاف پذیر است تا کار شما مانند removeNbers () حذف شود: برای حذف شماره ها از متن متنی داده شده ، weightTfIdf (): برای مدت فرکانس و فرکانس اسناد معکوس ، tm_reduce (): برای ترکیب تبدیل ها ، removePunctuation () به علائم نگارشی را از سند متن داده شده و موارد دیگر را حذف می کند.

مستندات

۱۳. MICE Package

بسته یادگیری ماشین با R، MICE به واردات چند متغیره از طریق توالی زنجیر اشاره دارد. تقریباً در تمام مدت ، توسعه دهنده پروژه با مجموعه داده های یادگیری ماشین که مقدار از دست رفته است ، با یک مشکل مشترک روبرو شده است. این بسته با استفاده از تکنیک های مختلف می تواند مقادیر گمشده را مورد استفاده قرار دهد.

این بسته شامل چندین کارکرد مانند بازرسی از الگوهای داده های گمشده ، تشخیص کیفیت مقادیر مجاز ، تجزیه و تحلیل داده های کامل شده ، ذخیره و صادرات داده های وارد شده در قالب های مختلف و موارد دیگر می باشد.

۱۴. igraph

بسته تحلیل شبکه ، igraph یکی از بسته های قدرتمند R برای علم داده است. این مجموعه ای از ابزارهای قدرتمند ، کارآمد ، آسان برای استفاده و قابل حمل و تحلیل شبکه قابل حمل است. همچنین ، این بسته کد منبع باز و رایگان است. علاوه بر این ، igraphn را می توان در Python ، C / C ++ و Mathematica برنامه ریزی کرد.

این بسته دارای چندین کارکرد برای تولید نمودارهای تصادفی و منظم ، تجسم یک نمودار و… می باشد همچنین می توانید با استفاده از این بسته R با نمودار بزرگ خود کار کنید. برخی از الزامات استفاده از این بسته وجود دارد: برای لینوکس ، کامپایلر C و C ++ لازم است.

نصب این بسته برنامه نویسی R برای علم داده:

install.packages(“igraph”)

برای بارگیری این بسته ، باید این دستور را بنویسید:

library(igraph)

مستندات

۱۵. ROCR

بسته R برای علم داده ، ROCR ، برای تجسم عملکرد طبقه بندی کننده های امتیاز دهی استفاده می شود. این بسته انعطاف پذیر و قابل استفاده است. فقط سه دستور و مقدار پیش فرض برای پارامترهای اختیاری مورد نیاز است. این بسته برای توسعه منحنی های عملکرد ۲D پارامتر برش استفاده می شود. در این بسته چندین کارکرد مانند پیش بینی () وجود دارد که برای ایجاد اشیاء پیش بینی ، کارایی () استفاده می شود که برای ایجاد اشیاء عملکرد و غیره استفاده می شود.

مستندات

۱۶. DataExplorer

بسته DataExplorer یکی از کاربردهای بسیار آسان برای بسته بندی های R برای علم داده است. در میان کارهای علمی متعدد داده ، تجزیه و تحلیل داده های اکتشافی (EDA) یکی از آنهاست. در تجزیه و تحلیل داده های اکتشافی ، تحلیلگر داده ها باید توجه بیشتری به داده ها داشته باشد. اما ، بررسی و رسیدگی به داده ها به صورت دستی یا استفاده از کد نویسی ضعیف کار ساده ای نیست. اتوماسیون تجزیه و تحلیل داده ها مورد نیاز است.

این بسته R برای علم داده ، اتوماسیون اکتشاف داده ها را فراهم می کند. این بسته برای اسکن و تحلیل هر متغیر و تجسم آنها استفاده می شود. در صورت گسترده بودن مجموعه داده مفید است. بنابراین ، تجزیه و تحلیل داده ها می تواند دانش پنهان داده ها را به صورت کارآمد و بی دردسر استخراج کند.

بسته را می توان مستقیماً با استفاده از کد زیر از CRAN نصب کرد:

install.packages(“DataExplorer”)

برای بارگیری این بسته R ، باید بنویسید:

library(DataExplorer)

مستندات

۱۷. mlr

یکی از باورنکردنی ترین بسته های یادگیری ماشین R بسته بندی mlr است. این بسته رمزگذاری چندین کار یادگیری ماشین است. این بدان معناست که تنها با استفاده از یک بسته واحد می توانید چندین کار را انجام دهید و دیگر نیازی به استفاده از سه بسته برای سه کار مختلف نیست.

بسته mlr یک رابط برای تکنیک های طبقه بندی و رگرسیون بیشمار است. این تکنیک ها شامل توضیحات پارامتر قابل خواندن با ماشین ، خوشه بندی ، نمونه گیری مجدد عمومی ، فیلتر ، استخراج ویژگی ها و موارد دیگر می باشد. همچنین می توان عملیات موازی انجام داد.

برای نصب باید از کد زیر استفاده کنید:

install.packages(“mlr”)

برای بارگیری این بسته:

library(mlr)

۱۸. arules

بسته ، آراول ها (قوانین انجمن معدن و موارد متداول) یک پکیج یادگیری ماشین R است که بطور گسترده استفاده می شود. با استفاده از این بسته می توان چندین عملیات را انجام داد. این عملیات بازنمایی و تحلیل تراکنش داده ها و الگوهای و دستکاری داده ها است. پیاده سازی C الگوریتم های استخراج انجمن Apriori و Eclat نیز موجود است.

۱۹. mboost

یکی دیگر از بسته های یادگیری ماشین R برای علوم داده mboost است. این بسته تقویتی مبتنی بر مدل دارای یک الگوریتم نزول شیب عملکردی برای بهینه سازی توابع ریسک کلی با استفاده از درختان رگرسیون یا برآوردهای حداقل مربعات مؤلفه است. همچنین ، این یک مدل تعامل را برای داده های بصورت بالقوه بالا فراهم می کند.

مستندات

۲۰. party

بسته دیگر در یادگیری ماشین با R مهمانی است. این جعبه ابزار محاسباتی برای پارتیشن بندی بازگشتی استفاده می شود. عملکرد اصلی یا هسته اصلی این بسته یادگیری ماشین ctree () است. این یک کارکرد گسترده است که باعث کاهش زمان آموزش و تعصب می شود.

مستندات

پایان مبحث

 

R چنین زبان برنامه نویسی برجسته ای است که از روش ها و نمودارهای آماری برای کشف داده ها استفاده می کند. نیازی به گفتن نیست ، این زبان دارای چندین شماره از بسته های یادگیری ماشین R ، یک ابزار باورنکردنی RStudio و آسان درک نحو برای توسعه پروژه های پیشرفته یادگیری ماشین است. در یک بسته R ml مقادیر پیش فرض وجود دارد. قبل از اعمال آن در برنامه خود ، باید با جزئیات در مورد گزینه های مختلف آگاهی داشته باشید. با استفاده از این بسته های یادگیری ماشینی ، هر کسی می تواند یک مدل یادگیری ماشین کارآمد یا مدل علوم داده ایجاد کند. سرانجام ، R یک زبان منبع باز است و بسته های آن به طور مداوم در حال رشد هستند.

 

اگر پیشنهادی یا سؤالی دارید ، لطفاً در بخش نظرات ما نظر دهید. همچنین می توانید از طریق رسانه های اجتماعی این مقاله را با دوستان و خانواده خود به اشتراک بگذارید.

 

منبع
به این پست امتیاز دهید.
برچسب ها
مشاهده بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

همچنین ببینید

بستن
بستن