File size: 17,231 Bytes
d48d4f3
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
مثلا رزنتا فکر کنم ۲۰۴۸ خروجیشه خب بعد از اینکه گلوبال اوریج میخوره یه فلت میشه یه ۲۰۴۸ در واقع بهت میده شما میتونید کانکشن یا نه مثلا ورودی چی بوده مثلاً ۶۴۰ در ۶۴۰ فقط این لایه فیچرز داره اینو مستقیما سیف کنیم پروژه پروژه فرق داره مثلاً پروژه من عکس ورودی ربات رو که میگیرم برای من نیم صفحه عکس ۶۴ در ۶۴ سیف کنم حجم بالایی داره میدمش به یه موبایل ورژن سه میارتش به ۹۹۶ تا دونه اونو سیوش میکنم نگه دارم یه بردار خیلی بهتر از یه عکس مثلا ۶۴ در سه کانال هست و این از این داره شما استفاده نمیک

چرا وقتی فرا می‌خونی بعضیاشو اینطوریه که مثلاً میگه اینکلود تاپ فکر کنم فالس میزنی اون تیکه آخر بهت نمیده یا مثل اینجا فقط لایه اف سیشو جایگزین می کنیم نه اف سیشو عوض کردم ببین اومدم تو بیس مدل دات اف سی فقط اونا فولی کانکت آخر میاد جایگزین میکنه دیگه و که زدم میایم در واقع اون عملیات رو انجام میدیم که حالا من اینو گذاشتم مثلا پاکی رفته دوباره بذاریم شروع میکنه به ترین کردن و رفتن دوباره ایوللیت میکنه این داستانا دیگه تکراریه اینجا خب دفعه قبلی اومدیم دقت رو اعلام کردیم هدفمون این بود که فقط بگیم مثلا تو

دقت کلی مدل چیه ما یه چیزی داریم به نام کانفیوژن ماتریکس و اینو دیگه گفتم شما خب یه دیتا ستی داری میخوای ببینی چه جوریه مثلا گربه و سگ شباهت زیادی به هم دارند پس اگر ما ببینیم گربه ۶۴۴ تا گربه تشخیص داده ولی بیشترینشو سگ تشخیص داده تو بقیه ۱۳۶ تا مثلا سگ تشخیص کدوم کلاس ها با هم نزدیکتره روند ترین چهه و اینا یه کانفیوژن ماتریکس در واقع تشکیل میدی که دیگه این از استفاده کردم اکیورسیژن و ریکال ویژه ماترییکس رو فرا میخونی در واقع تورولیبل وشن رو بهش میدی خودش دیگه حالا با حالت های خاصی که در نظر میگیری در واقع بهت این خروجی رو میده

بدون ترنسفرینگم اینکه فقط شما ساختار اون مدلو می‌خواید وزنشو نمی‌خوای اون اونا دیگه میگی من فقط استراکچر شما رو می‌خوام برای من فرقی نداره شما رو چی ترن کردی اصلا دیتا ست من یه چیز دیگه است یه کار دیگه‌ای می‌خوام بکنم به جایی که بیای مثلاً وزنه خاصی رو لطف کنی هیچی وضعشه فقط ساختارلود می‌کنیم و بهش مدلو می‌چسبونید و میزاری از صفر ترین بشه تا اینجا سوال نیست اضافه هم سوال بپرسید حالا تا اون بشه من نالجیستلیشن رو بگم یا واستیم یکم سوال بپرسید گلو منم خشک شد دو تا سوال بپرس پیاده می‌کنی

آره دیگه بستگی داره چجوری حساب کنی اگه بخوای اصلاً می‌تونی یه جوری محاسبه را انجام بدی که اون وزن‌های اینجا بشه اون چیزایی که میخوای ازش مشتق بگیری و با بکوارد مشتقشو انجام بدیم باز بستگی داره به تعریفریفتون خیلی چرا سرچ کنی در میاد تمرین یکتونه نه سرچ کنید داره یه چیزایی میاد اون یکم الان جدیده خب یهو میبینی فردا کلی سایت مدیوم اومده گذاشته مدیوم میدونید چیه دیگه نه اونم آخرش توضیح میدم یه چیزی رو من فکر کنم فراموش کردم برگردم بهتون بگم

یه دستورایی داریم به نام دات ترین و داتیول خب شما اگر تو مرحله ترین هستید بزنید مدل ترین اگر تو ایولیشن تست هستید بزنید مدلv این یه تفاوتی با داره چه تفاوتی داره چه اتفاقی توی مدل باید بیفته وقتی توی ترینیم و وقتی توی ولیدیشن باید یه تفاوت کوچک داشته باشد نه چه تفاوتی با نوگر داره خب الان من اینجا گذاشتم مدل دات ایول اینجا نوگر هم گذاشتم چرا دراپ

چون داده تست رو که نمیتونه فقط خودش یه پارامترهایی داره و داره اون پارامترهای عوض میشه روی هیپاک‌های مختلف برای همین مثلاً یکی پاک هیچ تاثیری نداره بالا یه خودی نشون میدن و اینم مهمه یعنی توی حلقه هاتون حتما باید دوتا رو بزارید خب بریم ترانسفر لرنینگ با نالج دیسلیشن حالا اینجا من سورسش هم گذاشتم مقالهش هم دو سه تایی هست میتونید برید بخونید انواع خیلی مختلفی هم داره من ساده ترینش آوردم تو تمرین هم ازتون همینه ها انشالله خواهیم خواست و اینطوریه که اون عکسو الان می‌بینید دیگه

اینطوری که خوب شما دو تا مدل میاری یکیش به عنوان حالا معلم و شاگرد اون یکیشم شاگرد در نظر می‌گیری تفاوت گسترده‌ای که این دوتا دارند اینه که تعداد پارامترهای یکی خیلی بیشتر از اون یکیه و یکی اصلا میتونه جفتشون پیترین باشند میتونه نه فقط تیچرین کامل باشه حتی در بعضی موارد بهتره اول خود معلمه رو یه فاینتیون بکنی رو دیتا ست خاصت به بهترین دقت خود خودش برسه یا مثلا رو حالا کامپیوتر یا مثلا چیز سرور مثل اچ پی سی شریف اچ پی سی بهترین دقت خودش که رسید حالا بیا یه مدل و بر اساس خروجی اون ترین کنیم به چه صورت به این صورت که شما وقتی دارید لاس رو بکوارد کنی فقط میاید تفاوت خروجی مدللت با اون تروبل واقعی تو نگاه میک و مجبوری برای اینکه این اتفاق بیفته از مثلاً سافت مکس که عبور

آرگم عکسم بگیری و بیاد بهترین اون بردار رو برداره مثلاً اومده بین سه تا کلاس گربه و سگ و مثلاً میمون گفته این عکس ۸۰ درصد سگه ولی ممکنه ۱۵ درصد گربه باشه ۵ درصد هم میمون و شما میاید در نظر می‌گیرید این خروجی این مدل بوده سگ چرا چون بیشترین خروجی رو در نظر گرفتی روش آرگی مکس گرفتی این مدل درسته میفهمه کارش خوب بوده یا بد ولی نمیفهمه چه بهتر از این باشه چون میگه خب تموم شد دیگه درسته حدس زدم لیبل میایم چیکار میکنیم میایم خروجیش رو با خروجی اون معلم میسنجیم که اومده گفته ۹۵ درصد سگه ۵ درصد اشتباه داره و این دو تا خروجی رو دیگه با هم در نظر میگیریم این یکی از مدل های که خیلی الان استفاده میشه ازش و

دقتش بره بالا و در واقع اون لاجیت‌ها رو با هم مقایسه این حالا میاد یاد میگیره آهان من الان میدونم این ۹۵ درصد باید سگ می‌بوده من ۸۵ درصد سگ دیدم مثلاً ۹۰ درصد سگ دیدم ۱۰ درصد من هنوز مشکل دارم و میاد یه در واقع لاز فانکشن رو این تعریف میکنه و ادامه میده حالا اینطوریه که دو تیکه است با دو سه تا ضریب تمچر و فکر کنم یه لاندا میاد میگه خب مثلا ۵۰ درصد تو لیبل ها رو با چیز حساب کن یه وزنی بده به لیبل های که تیچر میده یه ۵۰ درصدش هم تولیبل در نظر بگیر که حالا با بازی کردن این پایپ پارامترهاش میتونید صددرصد از معلمه ببین اگه معلم خوب کار میکنه و اگر ۵۰ ۵۰ ببینی ۲۰ ۸۰ ببینید دیگه بستگی به کاربرد این الان اوکی شد یا

تو لیبل خروجی تیچره چیه خروجی تیچره هم یه دونه برداره میاد احتمالا رو میگه دیگه میگه این عکسی که به من دادی من با یه مدل مثلاً خیلی بزرگ خیلی دقیق اومدم گفتم این مثلاً انقدر احتمال داره مثلاً سگ باشه مثلاً ۹۵ درصد سگ باشه ۵ درصد احتمال داره چیزای دیگه باشه بعد شما میای روی این چیکار میکنی یه مکس میگیری که بتونی ببینی لیبل درست حدس زدی یا نه دیگه خب این الان شما به جای که آرگ مکسش بگیری بدی بهش میای همین وکتور لاجیت رو مقایسه کنی با استودنت استودنت میگه خب من باید خروجی این رو به این صورت در میوردم ۹۵ درصد سگ باشه مال من ۹۰ درصد پس یه ارور میده این خودش یه ارور بعد میاد در نظر میگیره خب من اینو بیشتر مثلا ۵ درصد گربه دیده

تیچره یه درصد دیده دوباره یه ارور اینا رو دوباره بکوارد میکنه باعث میشه مدله حالا دقت بهتری از قبلش داشته باشه چرا چون قبلش میگفت خب من سگ دادم دیگه کارم درست بود دیگه مثل اینه که یه امتحان از شما بگیریم انقدر امتحان آسون باشه همه ۲۰ بشن دانش همتون ۲۰ بوده نه حالا یه امتحان خیلی سخت‌تر بگیریم همه ۱۰ میشن کمک می‌کنیم که در واقع بهتر تحلیل داده بشه اون استودنت نه فقط از دقت چیزی که قبلا بوده میتونید در حد دو سه درصد بهتر بشه باز هم بستگی داره به تعداد پارامترهاش اون ضریب های های پارامترها همینطوری مثلا فقط اینو زدم آوردم مثلا ببینی شاید دقتش یه درصد هم شاید افزایش پیدا نکنه خودتون ران کنید توی بالا باید بزارید و خود تیچر هم باید خیلی خوب ترین بشه

وکتور اولیه چه وان هات ریلیبل ۱۰۰% صفره خب ببین درسته ولی با بهترین چیز نمی‌تونیم مقایسه کنیم اون دیگه میگه توانم همینه دیگه خیلی افزایش پیدا نمیکنه ما میخویم یه رفتاری شبیه تیچره داشته باشه و بهترین اون عکس اینه که درست میگی یکیش یک باقی صفره مثل اینه که صددرصد گربه بوده ولی آیا اون عکسه واقعا یه شباهت کوچیکی به سگ بوده به گربه نداشته اینو که اون لیبل شما نمیگه تیچر ولی میتونه بگه تیچر دیگه عملا دقتش ۹۹.۹ و میاد وقتی اون میگه این ۵ درصد هنوز شبیه گربه است اون واقعا عکس شبیه گربه هم بوده پنج درصد و این تاثیر داره روی اینکه مدل های دیگش اینه که حالا بیایم با اینا بازی کنیم لاجیتاشو مختلف بدیم یا از وسط شبکه ها خروجی

با هم مقایسه کنیم که یکم پیچیده میشه چون باید دقیقاً خب حالا سایزاتون که ندا تو همه چیزا به هم بخوره می‌تونید در دو سه مرحله بیاین این کارو بکنید همش فکر کنم تو این سورسه که گذاشتم انواع مدل‌هاش هست سرچ هم کنید میاد انواع مدلاشو خود پایتورچ و اینا پیاده کردن ولی خب مثلاً شما بخواین از یه رزنت ۵۰ یا رزنت ۱۰۱ به عنوان تیچر در نظر بگیرید رزت ۱۸ بزارید و لایه های وسط بخواهیم بگیرید یکم سخت میشه چون خیلی اینا لایه زیاد دارن و ساختارهاشون فرق داره این کل دنیای دیگه است اون میاد ولیو تعریف میکنه برای کریتیک مثل یه نقاده میاد به عنوان یه داور یه مربی بالا سرت میگه این اکشننی که انجام دادی خوب بود

خوب نبود حالا با تولید کردن یک عددی به نام ولیو کیو ولیو و اونجا هم دو تا شبکه مختلف و یه کوچولو با این فرق داره حالا بخوای بدم توضیح میدم حالا دیگه فرمولاش هست اینا رو از خود مقاله درآوردم میاد تعریف میکنه مثلا آلفا تا از مثلا تیچر بگیره یک منهای آلفا ازلیبل ها بگیره و یه لاس فکشن تعریف کرده که حالا تو تعریفش میتونید همه چی رو بخونید اینجاست که شما میتونید خیلی راحت همه چی رو تعریف کنید میتونی بیای سافت مکس تعریف کنی که در واقع پارامترهای مختلف بگیره کس انتروپی خودتون رو تعریف کنید لاس فکشن های خودتون رو بنویسید که تو تن یه کوچولو باید بیشتر زحمت بکشید و یه دانش بیشتری از برنامه نویسی میخواد و حالا اون دیستلیشن

لاسش که دیگه تعریف می‌کنید و بیاد مثلاً همین فرمول من نوشتم دیگه یک منها از کراسنتروپی مثلاً ترولیبل بگیره آلفا تا از مثلاً تیچر بگیره ترین لوپاتونم اینجا فرق داره تفاوتش اینه که خب عکس ورودیتون رو میارید یک بار میدیدش به یه مدل تیچر یک بار میدید به استودنت و دوتا پردیکشنش رو میارید میدید به لاس و خب این لوپاش فرق داره بقیش شبیه من اینجا رضا ۵۰ گذاشتم برای کلا فال نمیخوام ترین بشه و اف سیش عوض کردم فقط ۱۰ کلاسه بشه پس مجبوریم یه مقدار تیچر رو ترین کنیم چون فول کانکشن عوض کردیم و بعد حالا استودنت بیاریم تو کار و بقیه روند هم که عین همونه اینجا همونه دیگه ترین لوپ در واقع دیسپشن نالجشه

گرفتم دادم به لاس بک وارد کردم دقت‌هاشم که این یه مقدار طول میکشه ران بشه برای همین فایلشو در اختیارتون می‌ذارم و در واقع تو تمرینتونم اینطوری که صحبت شده قراره یه مدل خودتون بزنید روی دیتا ست حالا دیتا ستش یا ای ام نیسته دست خطه و یه مدل خودتون بزنید مدل بیارید انجام بدید یه قسمت همین باید دقتش مقایسه کنید و یه کوچولو تمرین سی ان ان رو نذارید روزهای آخر جی پی یو کم میاد کدداشونم که دادیم دیگه یه مقدار بخونید تغییرات لازمه رو خودتون بدید چون من همینطوری اینا رو زدم کد رو آوردم درست هست ولی بهترین نیست و یه کوچولو بازی کنید قیافه‌ها رو عوض کنید

که بتونی تمرینا رو انجام بدید حالا باز در مورد تمرین‌ها صحبت می‌کنم این فایل‌ها هم که میزارم من کلاس رو قطع می‌کنم حالا هر سوالی داشتید