File size: 35,914 Bytes
d48d4f3
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
اگه قطع شدم بهم اطلاع بدید خب سلام به نام خدا دوستان عزیز ارجمند عرض سلام و ادب خیلی خوش آمدید ما امروز در خدمتتون هستیم با مطلبی تحت عنوان سیتی سیلاس یا کانکشنیست تمپرال کلسیفیکیشن که صحبت میکنیم در مورد چیه و مجدداً برگشتیم به مباحث هوشمند مصنوعی مون و انشالله تو جلسات آتی یه سری مباحثی که اسمش برای خودمون میزاریم مباحث پیشرفته تر مطرح میکنیم و از اینجا به بعدش ممکنه هر چیزی به درد همتون نخوره و بعضیاتون از بعضی از این مواردی که عرض کردیم خدمتتون استفاده بکنید یکی از اون چیزهایی که میتونه به کارتون بیاد سیتی سیلاسه که خدمتتون بیان میکنم کجا کاربرد داره به این اسلاید از آرنن ها من مراجعه میکنم دوباره ما قبلا

واریانت‌های مختلف آرنا را بررسی کردیم وان تو وان رو داشتیم که گفتیم مثل یه شبکه عصبی ام ال پی ساده خودمونه وان تو منی داشتیم و مثال زدیم براتون که کجا کاربرد داره مثلاً یه عکس بهش میدید که توصیف کنید عکس چیه ها شما یه دونه ورودی دادید ولی اون باید برای شما یه سیکونس تولید کنه منی تو وان داشتیم که مثلاً فرض کنید که یه سوال میپرسید طرف باید با بله یا خیر جواب بده یه فیلم بهش نشون میدید باید بهتون فقط یک کار بگه این داره تو فیلم چه اتفاقی میفته مثلا یه کلاسیفیکیشن انجام بده و این منی تو وانن که اگه یادتون باشه خروجی ما تو آخرین در واقع لایه هیدن سبزه داره تولید میشه درسته یه سری منی تو من های داشتیم یه دونه مونده به سمت راست رو نگاه بفرمایید از اونایی که به ازای هر ورودی یک دونه خروجی تولید میشه و یه سری هم منی تو من های از جنس های

براتون صحبت کردیم که اول ما یه سری ورودی میدیم میریم تا یه جایی از اونجا به بعد شروع می‌کنیم خروجی تولید کردن و یه گروه دیگه‌ای باقی موند به نام منی تو منی‌هایی که خروجی هاش هیچ کدوم از اونا نبودن و نظم قبلی‌ها رو ندارن یعنی اینکه از یه جایی به بعد شروع شن و تا آخر باشن یا از اول باشن و تا آخر باشن و می‌تونه کاملاً شلخته رخ بده یعنی هر از گاهی یه خروجی بخواد تولید شه می‌خوایم امروز در مورد این صحبت کنیم که چگونه اینو با آرنا هندل کنیم خب و مثلاً اگه بخوایم باهاش مواجه بشیم شبکه عصبی آ یا چیزی که توسعه دادیم چگونه باید وزنش آپدیت بشن لاس رو چجوری میشه تعریف کرد ولی آخر و کاملا کیفی صحبت می‌کنیم و نحوه پیاده سازیش هم توی حالا کرا و همینطور پایتورچ آقای مهندس رنجبر میان خدمتتون با یه مثالی بیان می‌کنن اما در مورد کاربرد این صحبت کنیم کاربرد این

کجاست و چه ویژگی بارزی داره ویژگی بارزش اینه که اینا اوردر سینکرونوس هستند ولی تایم سینکرونوس نیستند خب یعنی اینکه ترتیب چیزی که می‌خوان تولید کنند با ترتیب ورودی شما سازگاره ولی به ازای هر فریم توی ورودی شما اونا یک فریم تو خروجی معادل تولید نمی‌کنن مثلاً فرض کنید صحبت کردن منه من دارم صحبت می‌کنم و می‌خواید شما کنید من چی گفتم و جمله مو بیان کنید مثلا من میگم سلام اگه تو اور تک حرف و فون و اینا بخواید آوان مراجعه کنید میگید صبح سلام اینجوریه که اول گفته میشه لا بع درسته و من باید تلاش بکنم که پیدا بکنم که کجا تا کجا سر کجا تا کجا لایو کجا تا کجا تنهاست و البته اگه ویس هم مثلاً سلام من مثلاً ۱۰۰ فریم ۵۰ فریم طول بکشه دلیل نداره که ۵۰

سومش به پنجاه سومش به لا و اینجوری بگذره درسته دیگه کجا می‌تونه کاربرد داشته باشه عرض به حضور شما اینکه شما یه مجموعه حرکت‌هایی انجام دادید خب و می‌خواید چیکار کنید وقت ندارید یا هزینه یعنی براتون سخته از منظر هزینه ای که بخواهید جدا جدا ببرید تو اردر فریم و ثانیه که مثلاً این حرکته مثلاً از اینجا تا دو و نیم ثانیه اولش فلان بوده و الی آخر مثلاً یه کاری کردید یکی دویده دور زده پریده خوابیده بلند شده دویده همچین چیزیو دارید ولی کل حرکت مثلا فرض کنید تو۰ فریم رخ داده یا ۱۰۰ فریم رخ داده و شما اینو دارید می‌دونید جمله چیه ولی نمیدونید کجا تا کجاشه طبیعتاً توی در واقع اوردر رو بیارید بالاتر از اون سلام بیاید جلوتر مثلاً جمله‌بندی مثلاً سلام من علیرضا هستم من کلششو به یه شبکه بدم ولی دیگه جدا جدا نکنم از کجا تا کجا سلام

از کجا تا کجا من بود و اینو بخوام واگذار کنم به خودش یه جوری تلاش بکنه اون یه کاری برای من بکنه دیگه توی چه سیستم‌هایی می‌تونه کاربرد داشته باشه توی شناسایی‌های دستخط وقتی یه چیزیو نوشتید با دست خط به خصوص وقتی که زنجیره‌ای و اینا می‌نویسید مثلاً شما جداگانه نیومدید مثلا اس و ال رو کنار هم اس و سی رو کنار هم الی آخر بدید ولی مجموعه از کلماتی دارید که الگوهای مختلفی توشه خب مثلاً ساینس رو دادید که اس و سی اولن بعد یه آی میاد بعد مثلا ممکنه زنجیره‌ای هم نوشته باشه بوک دادید و و الی آخر و بعدا یک کلمه بهش میدید که اصلاً ندیده تا الان و بهش میگید برام بنویس چی بود خب من نوشته‌ای آوردم تو برام تایپش کن در حد حرف به حرف بهم بگو این چیه و اون باید بره پیدا کنه که بگه خب من اونا رو تو ترینینگم دیدم الگو دیدم دیگه اس تنها رو ندیدم سی تنها رو ندیدم ساینس رو با هم دیدمکو دیدم علیو دیدم کار دیدم کت دیدم و و و

چیکار کنم پیدا بکنم اینا کاربرداییه که این مسائل منی تو منی حالا خروج شلخته داره خب یه پرانتزی باز بکنم وارد بحثمون بشیم تو این منی تووانا نگاه بکنید ما تا الان عرض به حضور شما که حالا موسم قفل کرده بخاطر اینکه اجازه بدید ببینم فعلا که قفل عرض به حضور شما که این منی تو وان ها خدمتتون عارضم که اینجوری بود که فقط به ازای آخری به آخری فقط خروجی تولید میکرد درسته یه پرانتزی باز بکنم چون اینجا به دردم میخوره بعضی از کسایی که با منی تو وان ها کار میکن میان چیکار میکنن میان میگن فرض کن تمام سبزها اومدن خروجی تولید کردن نه فقط اون آخری

تولید کرده ولی به سبزهای قبلی هم خروجی از جنس اون آخریه تولید کرده مثلاً اگه کلاسیفیکیشن بوده و تهش می‌خواسته بگه تو این فیلم داشتید می‌دوید همه این آبی‌هایی که تولید میشن همه چی باشن بخوان دویدن بازنمایی کنن خب دیگه خیلی هم بخوایم بگیم نه اون آخریه خیلی مهمتره زمانی که تو لاس بیاریم مثلاً وقتی که لاس نهایی رو میگیم لاس اول باید لاس دوم به علاوه سوم بگیم یه دبلیو برابر دوم چیکار کنیم شروع کنیم کمتر کردن خب ولی قبول دارید که میشد من تمام سبزها رو براش باز دوباره خروجی آبی تولید کنم از جنس منی تو منی های بشه که چی به ازای تک ورودی تک خروجی هم تولید میکنه قبوله یا نه حالا می‌خوام از این ایده اینجا استفاده کنم و بعد وارد بحثمون بشم بچه‌ها بحثی که ما داریم اول ایده رو ببینید همین قدر که عرض کردم خدمتتون این لزوماً به درد همه شما تو چیز نمیخوره و

بعضیاتون ممکنه اصلاً استفاده هم نداشته باشید از این رنگ‌های خود چیزم استفاده کنم رنگ‌های عمومی قرمز سبز آبی باشه ورودی‌ها رو اجازه بفرمایید قرمز بدم بعد چیزا رو سبز میدیم لایه هیدن و سبز میدیم و لایه‌های خروجی هم آبی میدم خب فرض کنید در عادی اینجا قرار بوده تولید شه اینجا قرار بوده تولید شه و اینجا خب برای اینکه اینو به یک مسئله منظم تری تبدیلش کنم با اون ایده استفاده میکنم میگم آقا فرض کنید مثلاً قرار بوده من یه ویس بهش دادم و توش گفتم سلام به سه لا و می‌خوام بشکونم

اینجا تولید کرده باشه که انتهای بوده یا اینجا بوده من قبول دارید می‌تونم با همون الگوئه بگم این دوتا قبلیش هم بهش میگم اینم جز سه بوده قبوله این کلاً این پکیج با هم اولیه بوده توکن اول بوده این دو تا با هم لا مثلاً بوده و این دوت آخری با هم چی بوده بوده یه همچین چیزی خب اینو که قبول داریم که من بعداً بتونم لاسی رو که تشکیل میدم چی باشه لاس که تشکیل میدم یه چیز منظم‌تر حالا از جنس های منی تو منی قدیمی باشه که خیلی مشکلی بر نخوره خب حالا فرض کنید که می‌خوام چیکار کنم می‌خوام که کارمو انجام بدم خب ماجرا اینه که مسئله رو اینجوری میشکونمش بعد وارد بحثش میشیم و چون یه جاهایی شما بک گراند ندارید فقط در حد به معرفی می‌گذره و عرض به حضور شما اگه خودتون خواستید چیکار می‌کنید بعداً مطالعه می‌کنید و شاید بیشتر از اینکه تئوری پشتش چیه اینکه بتونید

علی پیادش کنید براتون مسئله مهم‌تری خواهد بود چون هیچ کدومتون سی تی سیلاسو خودتون کد نخواهید زد که لاستشو بنویسید و از یکی از این فریم‌ورک‌ها آماده مثل مثلاً کراس سنسور فلو پایتور استفاده می‌کنید که همشون توش لاس‌هایی از جنس سی تی سی تعریف شده و ازش استفاده می‌کنیم با توابع مناسب خب ماجرا اینه که فرض کنید من در حد یه سری جمله می‌خوام بدم به چیز به اصطلاح ویس صدا بدم به ورودی توش یه سری جملات بیان میکنم و تو خروجی انتظار دارم تک تک کلمه هایی که اجرا کردمو چیکار کنه برام تایپ کنه مثلا جمله اولم هست مثلاً من علی را دیدم این صوت اوله به عنوان ورودی بهش میدم و این انتظار رو دارم این جداگانه تو خروجی متن من علی را دیدم و تولید کنه برام ها از اونایی که نمیدونم از کجا تا کجاش من بوده از کجا تا کجاش علی بوده یه

من و حسن به کوه رفتیم دوباره خب یه من دیگه باز توش وجود داشت این دفعه حسنی وجود داشت تو قبلی نبود و و حالا تصور کنید هزاران جمله برای ترینینگ دارید که کل دیتا ستتون رو پوشش میده و الی آخر و فرض کنید که چیه کلمات شما تو دیکشنری مثلاً تعدادش مثلاً ۱۰۰ تاست خب من علی تبدیل کن مثلاً این الان کارمون اینه خب من فقط یه پرانتزی هم باز کنم صوت هم برای اینکه به مطلب تبدیل کنیم قبلا در مورد این بهتون گفتم بالا اسپکتروگرم اینه که صوت یه عکس تبدیل میکنه یه محور محور زمان یه محور محور فرکانسسه و بهتون میگه تو هر زمان چه طیف فرکانس های با چه شدتی حضور دارن یه چیز رنگی بهتون میده جان دو بعدی رنگ شدت حالا شدت بگید من رنگ منظورم چیزه منظورم اون شدتشه میتونه سیاه و سفید نشونش بده خب ببینید اسپکتور

یک محور فرکانس یک محور زمان یه صوت کامل تو هر زمان تو هر فرکانس اون شدت رو با یه عدد نشون میدم آره یه همچین چیزی می‌شه مثلاً اسپکت رو گرم بزنم اینا مطلب داره همه چی دارن خب اینا چیزایی از این جنسن اون بالا بالا شکل بالایی که دارید میبینید صوت بر حسب زمانه اون آبیه ولی پایینیه که رنگی رنگی براتون کشیده یا اون سمت راستیه این چیه این عرض به حضور شما که اسپکتوروگرمشه که زمان فرکانس اومده حالا شدت یه چیزی رو تو زمان فرکانس های مختلف نشونتون داده و شما اینو به عنوان ورودی چیکار میکنید میتونید به شبکه های آرنت تو بدید خب آره اکثر بالا پایینی دیگه بالایی که آبیه که خودش بر حسب زمانه شما اول به عکس

عکس فیک اون عکسه رو میدید به عنوان ورودی باز شدت حضور یک فرکانس توی یک زمان خاص مثلا میگن که این فرکانس با چه شدتی حضور داره تو اف تی میگیره حالا خیلی فصل ترنسپورت میگیرن تا جایی که میدونم با اون شدت که حالا خودش عددی که به دست میاره یه عدد مختلطه ولی ابسلوتش میگیرن حالا اگه لازم باشه یه سری تغییراتی روش میدن کلمه صدا تن صدا یعنی چی تن هر فرد رو تشخیص بده احتمالا شما میتونید برید دیدگاه دیگه به اون برسید حالا من کار نکردم بلد نیستم ولی منطقا میشه رسید منط

قبلش میزنم یعنی یه صوت که میاد قبل از اینکه صوت به ورودی بدم اول این عکس را تولید میکنم عکس رو لایه لایه فرض کنید میدم به چیز آره این عکس رو میخوام به متن تبدیل با هر دقتی تخمین بزنند ولی ممکنه یک به حجم خیلی خیلی زیادی دیتا نیاز داشته باشن و تعداد نیرون هاشون خیلی خیلی زیاد باشه حتی ام پی ثابت شده که میتون اثبات ولی کس که کارهای چیز میکن نداریم که بگیم امکان نه نه نیست دیگه دلیلش اینه که من براتون اون سری هم ثابت کردم ما مسائل رو به سه دسته مسائل بین مسائل کلاسسیفیکیشن و مسائل رگریشن شکوندیم ما اون مسائل رو با هر دقتی

خیلی زیاد ممکنه اکسپوننشیالی تعدادش زیاد بشه میشه هر تابعی در عالم شناسایی زیاد دارن مثلاً چند چند میلیارد یا چند صد میلیارد یا چند هزار میلیارد پارامتر دارند و این سبب میشه که توابع فوق فوق پیچیده‌ای رو بتونن مدل فکر نمیکنم کار میکن تو کره کار میکنن و حدس میزنن که اینا اثبات میکن که میشود خب یعنی یا شرایط لازم و کافیش هم حتی ممکنه بگن که حداقل مثلا چقدر داده بخواهیم مثلا ثابت میشه این اتفاق میفته خب ماجرا اینه که بچه‌ها اسپکتور هم که این چجوری به دست میاد و اینا اصلا باز اگر حتی الان نمیدونید چیه یه چیز مهمی نیست چون دستورات آماده وجود داره تو در واقع مطلب پایتون و الی آخر که بزنید براتون بکشه

یعنی در این حده که میاد براتون حوزه زمان و فرکانسو در واقع تشخیص میده تو عکس‌ها شدتشو می‌گیره و الی آخر خب حالا فرض کنید ما یه عکس داریم که معادل عکس من علی را دیدم بوده و اون باید بیاد توکن‌های من علی را دیدم و برام تولید کنه بچه‌ها اینجا با باشید چون برام مهمه فرض کنید که دیتا ستی که من دارم ۱۰۰ تا کلمه داره مثلا فرض کنید که چه میدونم این حالا همینجوری به ذهنم خورد مثلاً این سیستم های ورودی پارکینگ هستن که عکس میگیرن از عکس چیز ماشین خودروی ماشین بعد بالا می‌نویسه ماشین فلان وارد شده خارج شد اون الان عکس گرفته به نوشته تبدیل کرده دیگه به تک تک توکن هاشو شکونده و اینجوریه که خب یه حدی داره دیگه مثلاً من الان ادعا کردم که فرض کنید دیتا چیز دایره لغات من صد تا کلمه داره و از این دیگه تخطی نمیکنه خب این ۱۰۰ تا رو دارم ولی جمله من علی را دیدم چیه مثلاً چند تا از اینا رو داره چهار تاشو داره از این ۱۰۰ تا این من علی

عادی می‌افته اینه که چی شما اینو قرمزها رو ورودی می‌دید سبز میره یه هیدن حساب میشه و میره به آبی میده آبیه باید چند تایی می‌بود اگه مثلاً منی تو وان بود که بعدش من کلاسیفیکیشن کنم بگم چیه باید ۱۰۰ تایی می‌بود باید ۱۰۰ تایی بود که من برم اعتماد بگیرم یا گیریدی نگاه کنم و بدترینش بالاترینشو انتخاب کنم بگم منه دیگه الانم فرض کنید که این اتفاق میفته یعنی آبی و صورتی های که من کشیدم یه چیز ۱۰۰ تایی تولید کردن که از جنس احتمال و سافت مکس زدم جمعشون یک میشه و هرچی بالاتر باشن احتمالشو داره بالاتر میبینه و الی آخر خب برای اینکه با ctc کار بکنید اولین کار جنبی که انجام میدید اینه که تو فرایند ما ترینینگ رو تستمون یه تفاوت های داره تو ترینینگ اون من میدونم جوابش هست من علی را دیدم میام سطر من

علی را و دیدمشو فقط جدا می‌کند اون چهار تا رو می‌کشم بیرون حالا یه لایه جدیدی به وجود میارم از چه رنگی استفاده نکردم مثلاً نارنجی خب یه لایه‌ای به وجود میارم که این دفعه فقط چی داره چهار تا داره و احتمال‌های تولید شده مربوط به جمله ترینینگمو میارم بالا به ازای هر ورودی بچه‌ها من خروجی حتماً دارم با این حقه‌ای که زدم که پرش کردم فضا رو درسته و حتما هم تعداد چند تا شد به تعداد توکن های موجود در جمله ترینینگم شد برای ترینینگ بعدی پنج تایی شد نارنجیم پنج تایی میشه خب حالا اینجا چی شده حالا اومدم احتمالات نه نه فقط میکشید بیرون هیچی در هیچ چیز ضرب نمیک من برداشتم از خوندن تئوری اینه که در هیچ چیز اما عین میکشینش بیرون دوباره هم سافت مک روش نمیزنید سابک زده شده قبلا فقط شما عددشو میکشید بیرون همین حالا میخویم

بعداً یه لاسی تعریف کنم که بره ببینه این خوبه یا نه اون چهار تا عدده خوب در اومدن یا نه که خوب نیستند از اون طریق گرادیان رو اعمال کنه و w های چیزمو آپدیت کنه اول شده ممکنه خیلی بدی باشن درسته و حالا میخوام اینو ببرم جلو حالا احتمال اینا همه عددا از جنس احتمالا دیگه بین صفر تا یکی توی مثلاً معادله من هم توی چیز اول فریم اول هم تو فریم دوم تا تو فریم آخر وجود داره قبول دارید یا نه یعنی من الان یه جدول مثلاً اگه ۱۰ فریم داشته باشم ده در چهار نارنجی رنگ دارن اینو قبول دارید عالی خب این جایی بود که باید بهش میرسیدم من یه ۱۰ در چهار نارنجی جدا کردم حالا می‌خوام بیام رو سیتی سی صحبت کنم که اصلاً این چیه و باید چیکارش کنیم این ۱۰ در چهار رو و چجوری یه چیزی تعریف بکنم یه لاسی تعریف بکنم که

بر اساس این ده در چاره بیاد وزن‌های شبکه‌مون که تو بخش‌های قرمز و سبز و آبی بوده رو اعمال بکنه و انشالله منو به جای خوبی برسونه تعداد ستون‌های عکس مثلاً می‌تونه اون باشه اگر عکس تو یکی یکی ستون ستون بهش بدیم اگه دو ستون دو ستون دو ستون یعنی اومدی دو ستون دو ستون جدا کردی ولی دو ستونش زیر هم بردار کردی خب یه جور دیگه یه معنی دیگه میده درسته یه همچین چیزی اون در ساده ترین حالت فرض کن اکثر ستون ستون دادم بهش ورودی خب به یه جدول نارنجی مثلا چهار در تعداد فریم می‌رسم که اینا اعدادی که توش پر شده بین صفر تا یک اند درسته اگر فرض کنید ما تو نقطه خوب ماجراییم یعنی فرض کنید وزننا به اندازه کافی تو وزن شبکه خوب ترین شدن انتظارمون اینه که چه اتفاقی بیفته نه عدد نگاه این گوشه بالا سمت چپیه بین این چهار تا کدومش بالاتر باشه اون بالاتری

منه بیشتر باشه یکی میرم جلوتر یا باید من باشم یا علی باشه نره را یا دیدم و پررنگ کنه با دوباره میرم سومی یا دوباره باید من باشم یا علی احسنت و یه اتفاقی که میفته یه الگوی این مدلی طوری مثلاً دربیاره فرض کنید بره پیدا کنه که مثلاً اولی و دومی من خیلی توش پررنگ بود سومی علی چهارمی تا هشتمی مثلاً راه و آخریش دهمی دیدم الان یه الگوی مجاز هست یا نیست ممکنه چیز باشه نه علی نه آها اگه اینو پیدا کنه تو ترینینگ که اولش که متداوله اون اشتباه میکنه و اصلا ممکنه تو شروع کنی اصلاً من بالا نباشه یعنی یه چیز دیگه بالاتر باشه و شما با لاس هی گرادیان میگیری هی میری آپدیت میکنی به این نقطه میرسه که چی این باید بیاد اصلاحش کنه تهش ولی باید شما رو به اون جمله من علی را دیدم برسونه یعنی الگو اگه خوب ترین شده باشه

کجا داریم استفاده میکنیم حالا آقای رنجبر میاد براتون توضیح میده توی ترجمه جمله زبان اشاره فرض کنید که یه اخبار ناشنوایان طرف میاد یه جمله رو اجرا میکنه من میدونم جمله این بود که همین مثلا رئیس جمهور به فلان کشور سفر کرد خب ولی نمیدونم از کجا تا کجا رئیس جمهور بود و خیلی هم شاید برام نیار که بیام ببرم در سطح لغت لغت ولی هزاران تا از این جملات بهش میدن که مثلا رئیس جمهور رو تو ۱۰۰ تا ۲۰۰ تا جمله ببین حالا یه جا اول جمله یا وسط جمله ولی خودش بره پیدا کنه ببینه چی بود و این برام بیاد چیکار کنه پیدا کنه از این منظر به اینجور مسائل میگن ویک سوپروایز خب یعنی اینکه نه اصلا آن سوپروایز کامله نه کاملا سوپروایزه یه چیزی بینابین یعنی من جمله من علی را دیدم بهش گفتم ولی بهش نگفتم از کجا تا کجا من و فلانه خب حالا چیکار باید بکنیم بچه‌ها اینجا دیگه یه سری موارد

در واقع حاشیه‌ای پیش میاد که من اجازه بدید رو مثال برم جلو خب و بعضیاشون ممکنه نیاز به بک گراند داشته باشه متوجه نشید و اگه نشدید هیچ ایراد نداره بهتون میگم از کجا برید مطالعه اول گذاشتم یعنی من اول گذاشتمش الان ولی بعدا که میخوام چیزشو آپدیت کنم رند لاس به اون آپدیت کنم میرم تو ستون های آبی صورتیه که جای علی واقعا پنجاهمیه آپدیت میشه آره ولی من به قول شما الان تو نارنجیم منو بالا گذاشتن چون چرا چون میخواستم این الگوی رخ بده یعنی الگوی ولیدی که از بالا گوشه سمت چپ شروع کنم به پایین سمت راست تمام بشه درسته بفرمایید تعریف نه نیست ممکنه تعداد فریمتون چیز نباشه

مثال خودش زده گفته فرض کنید من کلمه بیفی رو میخواستم شناسایی کنم یعنی یه صوتی بوده توش گفتم بیفی و تو در حد فونیم مثلا آوای ب ای ف و ای رو باید برام پیدا می‌کرده عمداً هم تکراری هم داده یعنی مثلاً من می‌تونستم اینجوری بنویسم من علی را در کنار دوست علی دیدم یعنی عمدا دوتا علی توش بندازم این عمدا ای توش باشه خب گفته چیکار کنید همون حرف ما رو زده گفته یه شبکه دارید ورودی دارید قرمزه هیدنش رفته سبزه حساب شده رفته چی حساب کرده به ازای تعداد تمام کلمات دیکشنریتون یه خروجی حساب کرده شما دستی بیاید چی فقط بی فیش بکشید بیرون تا جدول نارنجی ما رو به وجود بیارید و در ضمن نباید بگید چون بیفی دو تا ی داره من یک بار میکشم نه دقیقا چون برام مهمه که این توکن شناسایی بشه باید به همون تعد

فاصله انداخته اگه پشت سر هم بود چی مثلا فرض کن هلو می‌خوام اینو شناسایی کنه حالا اینم بهتون میگم چیکار کنیم فعلاً اینو گوشه ذهنتون بزارید آخرش یه تریک ساده است که توی حالا پیاده سازی هم بهتون میگیم خب کاری که کرده اینه که چی کاری که کرده اومده احتمالاتی که از شبکه پیدا کرده رو عیناً تو اون جدول بالایی که ما جدول نارنجی مون شد کپی کرده تا اینجا قبوله یا نه سوال در حد کلمه تشخیص بله در اینجا در حد آوا بوده من ممکنه آره دیگه الان کار که یوتیوب هست زیرنویس چیز بهتون میده آنلاین بهتون چیکار داره میکنه صوت داره میگیره در حد آوا یا در حد مثلا کلمه بهتون خروجی میده همه اینا شدنیه شما میتونید توکنتون چیه در حد آوا در حد کلمه دو تا من سه تا علی

در واقع فرایند اسپکتور ستون اول من بوده از لحاظ زمانی معادل من هست چون من صوت من نگاه کن صوت من نه صوت من محور تیه دیگه صوت که ضبط میکنم بالاخره من وقتی میگم من علی را یعنی من اول منو میگم بعد علی رو میگم حالا به شبکه دارم میگم ببین تو برو پیدا کن دیگه خودت برو پیدا کن کجا من بوده زمانم مطرحه دیگه بله اصلا کلمه این سیتی مخفف چی بود کانکست تمرال کلاسیفیکیشن تمپرال معنی زمانی داره همون زمان چیز هم ترتیب اردر سینکرون دقیق یعنی رعایت میشه ولی فریم به فریم رعایت نمیشه اگه صوت شما ۱۰۰ فریم داشته باشه اینجوری نیست که از فریم یک باید یک یک آوا فریم دو یک آوا تولید شه ممکنه یه آوا به هر دلیلی سه فریم طول بکشه آره دیگه ارد

بلوک‌های صورتی رو اضافه کردن نه دیگه دوتاشون یکیه الان اون عددی که توی چیز پیدا شده تون برای ای دوبار کپیش میکنید هم تو سطر دوم هم تو سطر چهارم تو لحظه اول خب همون عین همونو گذاشته خب یه همچین چیزی نوشته نوشته وای صف الی آخر خب اوکی حالا می‌خواید اینو برید چیکار کنید یه یه کمک کنید به لاس فانکشن خب که قبلا هم تازه خودمون نزدیم که اینکه بیاد این مسیره رو بره پیدا کنه بچه‌ها چندین راه اینجا وجود داره ما پارسال باید سال توی درسمون چهار پنج جلسه در مورد موضوعی به نام هیدن مارک گفت مدل یا صحبت کردیم که ورژن های غیر دیپ و قدیمی آرن بودن یعنی

اونجا توش تو اونجا یه سری مفاهیم گفتیم که اگه دلتون میخواد با جزئیات بدونید یا این اسلایدها رو با جزئیات ترک کنید باید برید اون فیلم‌ها رو ببینید که اگه خواستید من لینکاشو در اختیارتون قرار میدم ولی شاید نیارزه براتون الان لااقل توی بحبوحه مثلاً امتحانات و اینا و تو اونجا در مورد یه سری مباحث صحبت کردیم یکیش مثلاً موضوعی بود به نام روش ویتربی این کلمه رو به خاطر داشته باشید یا یکیش در مورد الگوریتم فوروارد بکوارد یا الگوریتم فوروارد الگوریتم جلو رو و عقب رو اینا اصطلاحاتی که من اونجا صحبت کردم اگه دلتون میخواد برید بپرسید بدید بخونید خب من باید در حد نیازتون الان بهتون میگم که انشالله بعدش بریم پیاده‌سازی عملیش ببینیم خب عرض به حضور شما اینکه تو روش ویتربی اتفاقی که میفته اینه که میگه ببین تو این ماتریس نارنجیه بالا رو داری خب میگه برو نگاه کن که چه مسیرهای مجازی وجود

از ب شروع بشن به ای آخر ختم شه درسته مثلاً فرض کنید که سه تای اول ب باشه چهارمی و پنجمی ای باشه ششمی اف باشه بقیه اش ای آخر باشه این یه راه دوتای اول بی باشه ای بعداً مثلاً سه تا بعدی یکی بعدیش فلان درسته همه حالت‌ها مجاز خیلی حالت خیلی حالت با یه الگویی به نام داینامیک پروگرمینگ میاد لایه لایه میره جلو میگه که خب من اگه بخوام همه حالت ها رو مستقل از هم فرض کنم کار طولانی میشه لایه لایه میره جلو و میگه برو احتمال مسیرهای مجاز رو برام پیدا کن مثلا فرض کنید هزار تا مسیر مجازه میره تمام اون هزار تا احتمالاشو میره محاسبه میکنه خب اگه لازم باشه و ماکسیممش مثلا فرض کن ۵ هزارمه مثلاً ماکسیمم احتمال اینکه یک مسیر از بی به ای ختم بشه واقعاً تو این اوردرم فکر نکنید مثلا ۲۰ درصد و ۵۰ درصد ایناست مثلاً ۵۰۰۰ خب