Spaces:
Sleeping
Sleeping
File size: 35,914 Bytes
d48d4f3 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 |
اگه قطع شدم بهم اطلاع بدید خب سلام به نام خدا دوستان عزیز ارجمند عرض سلام و ادب خیلی خوش آمدید ما امروز در خدمتتون هستیم با مطلبی تحت عنوان سیتی سیلاس یا کانکشنیست تمپرال کلسیفیکیشن که صحبت میکنیم در مورد چیه و مجدداً برگشتیم به مباحث هوشمند مصنوعی مون و انشالله تو جلسات آتی یه سری مباحثی که اسمش برای خودمون میزاریم مباحث پیشرفته تر مطرح میکنیم و از اینجا به بعدش ممکنه هر چیزی به درد همتون نخوره و بعضیاتون از بعضی از این مواردی که عرض کردیم خدمتتون استفاده بکنید یکی از اون چیزهایی که میتونه به کارتون بیاد سیتی سیلاسه که خدمتتون بیان میکنم کجا کاربرد داره به این اسلاید از آرنن ها من مراجعه میکنم دوباره ما قبلا واریانتهای مختلف آرنا را بررسی کردیم وان تو وان رو داشتیم که گفتیم مثل یه شبکه عصبی ام ال پی ساده خودمونه وان تو منی داشتیم و مثال زدیم براتون که کجا کاربرد داره مثلاً یه عکس بهش میدید که توصیف کنید عکس چیه ها شما یه دونه ورودی دادید ولی اون باید برای شما یه سیکونس تولید کنه منی تو وان داشتیم که مثلاً فرض کنید که یه سوال میپرسید طرف باید با بله یا خیر جواب بده یه فیلم بهش نشون میدید باید بهتون فقط یک کار بگه این داره تو فیلم چه اتفاقی میفته مثلا یه کلاسیفیکیشن انجام بده و این منی تو وانن که اگه یادتون باشه خروجی ما تو آخرین در واقع لایه هیدن سبزه داره تولید میشه درسته یه سری منی تو من های داشتیم یه دونه مونده به سمت راست رو نگاه بفرمایید از اونایی که به ازای هر ورودی یک دونه خروجی تولید میشه و یه سری هم منی تو من های از جنس های براتون صحبت کردیم که اول ما یه سری ورودی میدیم میریم تا یه جایی از اونجا به بعد شروع میکنیم خروجی تولید کردن و یه گروه دیگهای باقی موند به نام منی تو منیهایی که خروجی هاش هیچ کدوم از اونا نبودن و نظم قبلیها رو ندارن یعنی اینکه از یه جایی به بعد شروع شن و تا آخر باشن یا از اول باشن و تا آخر باشن و میتونه کاملاً شلخته رخ بده یعنی هر از گاهی یه خروجی بخواد تولید شه میخوایم امروز در مورد این صحبت کنیم که چگونه اینو با آرنا هندل کنیم خب و مثلاً اگه بخوایم باهاش مواجه بشیم شبکه عصبی آ یا چیزی که توسعه دادیم چگونه باید وزنش آپدیت بشن لاس رو چجوری میشه تعریف کرد ولی آخر و کاملا کیفی صحبت میکنیم و نحوه پیاده سازیش هم توی حالا کرا و همینطور پایتورچ آقای مهندس رنجبر میان خدمتتون با یه مثالی بیان میکنن اما در مورد کاربرد این صحبت کنیم کاربرد این کجاست و چه ویژگی بارزی داره ویژگی بارزش اینه که اینا اوردر سینکرونوس هستند ولی تایم سینکرونوس نیستند خب یعنی اینکه ترتیب چیزی که میخوان تولید کنند با ترتیب ورودی شما سازگاره ولی به ازای هر فریم توی ورودی شما اونا یک فریم تو خروجی معادل تولید نمیکنن مثلاً فرض کنید صحبت کردن منه من دارم صحبت میکنم و میخواید شما کنید من چی گفتم و جمله مو بیان کنید مثلا من میگم سلام اگه تو اور تک حرف و فون و اینا بخواید آوان مراجعه کنید میگید صبح سلام اینجوریه که اول گفته میشه لا بع درسته و من باید تلاش بکنم که پیدا بکنم که کجا تا کجا سر کجا تا کجا لایو کجا تا کجا تنهاست و البته اگه ویس هم مثلاً سلام من مثلاً ۱۰۰ فریم ۵۰ فریم طول بکشه دلیل نداره که ۵۰ سومش به پنجاه سومش به لا و اینجوری بگذره درسته دیگه کجا میتونه کاربرد داشته باشه عرض به حضور شما اینکه شما یه مجموعه حرکتهایی انجام دادید خب و میخواید چیکار کنید وقت ندارید یا هزینه یعنی براتون سخته از منظر هزینه ای که بخواهید جدا جدا ببرید تو اردر فریم و ثانیه که مثلاً این حرکته مثلاً از اینجا تا دو و نیم ثانیه اولش فلان بوده و الی آخر مثلاً یه کاری کردید یکی دویده دور زده پریده خوابیده بلند شده دویده همچین چیزیو دارید ولی کل حرکت مثلا فرض کنید تو۰ فریم رخ داده یا ۱۰۰ فریم رخ داده و شما اینو دارید میدونید جمله چیه ولی نمیدونید کجا تا کجاشه طبیعتاً توی در واقع اوردر رو بیارید بالاتر از اون سلام بیاید جلوتر مثلاً جملهبندی مثلاً سلام من علیرضا هستم من کلششو به یه شبکه بدم ولی دیگه جدا جدا نکنم از کجا تا کجا سلام از کجا تا کجا من بود و اینو بخوام واگذار کنم به خودش یه جوری تلاش بکنه اون یه کاری برای من بکنه دیگه توی چه سیستمهایی میتونه کاربرد داشته باشه توی شناساییهای دستخط وقتی یه چیزیو نوشتید با دست خط به خصوص وقتی که زنجیرهای و اینا مینویسید مثلاً شما جداگانه نیومدید مثلا اس و ال رو کنار هم اس و سی رو کنار هم الی آخر بدید ولی مجموعه از کلماتی دارید که الگوهای مختلفی توشه خب مثلاً ساینس رو دادید که اس و سی اولن بعد یه آی میاد بعد مثلا ممکنه زنجیرهای هم نوشته باشه بوک دادید و و الی آخر و بعدا یک کلمه بهش میدید که اصلاً ندیده تا الان و بهش میگید برام بنویس چی بود خب من نوشتهای آوردم تو برام تایپش کن در حد حرف به حرف بهم بگو این چیه و اون باید بره پیدا کنه که بگه خب من اونا رو تو ترینینگم دیدم الگو دیدم دیگه اس تنها رو ندیدم سی تنها رو ندیدم ساینس رو با هم دیدمکو دیدم علیو دیدم کار دیدم کت دیدم و و و چیکار کنم پیدا بکنم اینا کاربرداییه که این مسائل منی تو منی حالا خروج شلخته داره خب یه پرانتزی باز بکنم وارد بحثمون بشیم تو این منی تووانا نگاه بکنید ما تا الان عرض به حضور شما که حالا موسم قفل کرده بخاطر اینکه اجازه بدید ببینم فعلا که قفل عرض به حضور شما که این منی تو وان ها خدمتتون عارضم که اینجوری بود که فقط به ازای آخری به آخری فقط خروجی تولید میکرد درسته یه پرانتزی باز بکنم چون اینجا به دردم میخوره بعضی از کسایی که با منی تو وان ها کار میکن میان چیکار میکنن میان میگن فرض کن تمام سبزها اومدن خروجی تولید کردن نه فقط اون آخری تولید کرده ولی به سبزهای قبلی هم خروجی از جنس اون آخریه تولید کرده مثلاً اگه کلاسیفیکیشن بوده و تهش میخواسته بگه تو این فیلم داشتید میدوید همه این آبیهایی که تولید میشن همه چی باشن بخوان دویدن بازنمایی کنن خب دیگه خیلی هم بخوایم بگیم نه اون آخریه خیلی مهمتره زمانی که تو لاس بیاریم مثلاً وقتی که لاس نهایی رو میگیم لاس اول باید لاس دوم به علاوه سوم بگیم یه دبلیو برابر دوم چیکار کنیم شروع کنیم کمتر کردن خب ولی قبول دارید که میشد من تمام سبزها رو براش باز دوباره خروجی آبی تولید کنم از جنس منی تو منی های بشه که چی به ازای تک ورودی تک خروجی هم تولید میکنه قبوله یا نه حالا میخوام از این ایده اینجا استفاده کنم و بعد وارد بحثمون بشم بچهها بحثی که ما داریم اول ایده رو ببینید همین قدر که عرض کردم خدمتتون این لزوماً به درد همه شما تو چیز نمیخوره و بعضیاتون ممکنه اصلاً استفاده هم نداشته باشید از این رنگهای خود چیزم استفاده کنم رنگهای عمومی قرمز سبز آبی باشه ورودیها رو اجازه بفرمایید قرمز بدم بعد چیزا رو سبز میدیم لایه هیدن و سبز میدیم و لایههای خروجی هم آبی میدم خب فرض کنید در عادی اینجا قرار بوده تولید شه اینجا قرار بوده تولید شه و اینجا خب برای اینکه اینو به یک مسئله منظم تری تبدیلش کنم با اون ایده استفاده میکنم میگم آقا فرض کنید مثلاً قرار بوده من یه ویس بهش دادم و توش گفتم سلام به سه لا و میخوام بشکونم اینجا تولید کرده باشه که انتهای بوده یا اینجا بوده من قبول دارید میتونم با همون الگوئه بگم این دوتا قبلیش هم بهش میگم اینم جز سه بوده قبوله این کلاً این پکیج با هم اولیه بوده توکن اول بوده این دو تا با هم لا مثلاً بوده و این دوت آخری با هم چی بوده بوده یه همچین چیزی خب اینو که قبول داریم که من بعداً بتونم لاسی رو که تشکیل میدم چی باشه لاس که تشکیل میدم یه چیز منظمتر حالا از جنس های منی تو منی قدیمی باشه که خیلی مشکلی بر نخوره خب حالا فرض کنید که میخوام چیکار کنم میخوام که کارمو انجام بدم خب ماجرا اینه که مسئله رو اینجوری میشکونمش بعد وارد بحثش میشیم و چون یه جاهایی شما بک گراند ندارید فقط در حد به معرفی میگذره و عرض به حضور شما اگه خودتون خواستید چیکار میکنید بعداً مطالعه میکنید و شاید بیشتر از اینکه تئوری پشتش چیه اینکه بتونید علی پیادش کنید براتون مسئله مهمتری خواهد بود چون هیچ کدومتون سی تی سیلاسو خودتون کد نخواهید زد که لاستشو بنویسید و از یکی از این فریمورکها آماده مثل مثلاً کراس سنسور فلو پایتور استفاده میکنید که همشون توش لاسهایی از جنس سی تی سی تعریف شده و ازش استفاده میکنیم با توابع مناسب خب ماجرا اینه که فرض کنید من در حد یه سری جمله میخوام بدم به چیز به اصطلاح ویس صدا بدم به ورودی توش یه سری جملات بیان میکنم و تو خروجی انتظار دارم تک تک کلمه هایی که اجرا کردمو چیکار کنه برام تایپ کنه مثلا جمله اولم هست مثلاً من علی را دیدم این صوت اوله به عنوان ورودی بهش میدم و این انتظار رو دارم این جداگانه تو خروجی متن من علی را دیدم و تولید کنه برام ها از اونایی که نمیدونم از کجا تا کجاش من بوده از کجا تا کجاش علی بوده یه من و حسن به کوه رفتیم دوباره خب یه من دیگه باز توش وجود داشت این دفعه حسنی وجود داشت تو قبلی نبود و و حالا تصور کنید هزاران جمله برای ترینینگ دارید که کل دیتا ستتون رو پوشش میده و الی آخر و فرض کنید که چیه کلمات شما تو دیکشنری مثلاً تعدادش مثلاً ۱۰۰ تاست خب من علی تبدیل کن مثلاً این الان کارمون اینه خب من فقط یه پرانتزی هم باز کنم صوت هم برای اینکه به مطلب تبدیل کنیم قبلا در مورد این بهتون گفتم بالا اسپکتروگرم اینه که صوت یه عکس تبدیل میکنه یه محور محور زمان یه محور محور فرکانسسه و بهتون میگه تو هر زمان چه طیف فرکانس های با چه شدتی حضور دارن یه چیز رنگی بهتون میده جان دو بعدی رنگ شدت حالا شدت بگید من رنگ منظورم چیزه منظورم اون شدتشه میتونه سیاه و سفید نشونش بده خب ببینید اسپکتور یک محور فرکانس یک محور زمان یه صوت کامل تو هر زمان تو هر فرکانس اون شدت رو با یه عدد نشون میدم آره یه همچین چیزی میشه مثلاً اسپکت رو گرم بزنم اینا مطلب داره همه چی دارن خب اینا چیزایی از این جنسن اون بالا بالا شکل بالایی که دارید میبینید صوت بر حسب زمانه اون آبیه ولی پایینیه که رنگی رنگی براتون کشیده یا اون سمت راستیه این چیه این عرض به حضور شما که اسپکتوروگرمشه که زمان فرکانس اومده حالا شدت یه چیزی رو تو زمان فرکانس های مختلف نشونتون داده و شما اینو به عنوان ورودی چیکار میکنید میتونید به شبکه های آرنت تو بدید خب آره اکثر بالا پایینی دیگه بالایی که آبیه که خودش بر حسب زمانه شما اول به عکس عکس فیک اون عکسه رو میدید به عنوان ورودی باز شدت حضور یک فرکانس توی یک زمان خاص مثلا میگن که این فرکانس با چه شدتی حضور داره تو اف تی میگیره حالا خیلی فصل ترنسپورت میگیرن تا جایی که میدونم با اون شدت که حالا خودش عددی که به دست میاره یه عدد مختلطه ولی ابسلوتش میگیرن حالا اگه لازم باشه یه سری تغییراتی روش میدن کلمه صدا تن صدا یعنی چی تن هر فرد رو تشخیص بده احتمالا شما میتونید برید دیدگاه دیگه به اون برسید حالا من کار نکردم بلد نیستم ولی منطقا میشه رسید منط قبلش میزنم یعنی یه صوت که میاد قبل از اینکه صوت به ورودی بدم اول این عکس را تولید میکنم عکس رو لایه لایه فرض کنید میدم به چیز آره این عکس رو میخوام به متن تبدیل با هر دقتی تخمین بزنند ولی ممکنه یک به حجم خیلی خیلی زیادی دیتا نیاز داشته باشن و تعداد نیرون هاشون خیلی خیلی زیاد باشه حتی ام پی ثابت شده که میتون اثبات ولی کس که کارهای چیز میکن نداریم که بگیم امکان نه نه نیست دیگه دلیلش اینه که من براتون اون سری هم ثابت کردم ما مسائل رو به سه دسته مسائل بین مسائل کلاسسیفیکیشن و مسائل رگریشن شکوندیم ما اون مسائل رو با هر دقتی خیلی زیاد ممکنه اکسپوننشیالی تعدادش زیاد بشه میشه هر تابعی در عالم شناسایی زیاد دارن مثلاً چند چند میلیارد یا چند صد میلیارد یا چند هزار میلیارد پارامتر دارند و این سبب میشه که توابع فوق فوق پیچیدهای رو بتونن مدل فکر نمیکنم کار میکن تو کره کار میکنن و حدس میزنن که اینا اثبات میکن که میشود خب یعنی یا شرایط لازم و کافیش هم حتی ممکنه بگن که حداقل مثلا چقدر داده بخواهیم مثلا ثابت میشه این اتفاق میفته خب ماجرا اینه که بچهها اسپکتور هم که این چجوری به دست میاد و اینا اصلا باز اگر حتی الان نمیدونید چیه یه چیز مهمی نیست چون دستورات آماده وجود داره تو در واقع مطلب پایتون و الی آخر که بزنید براتون بکشه یعنی در این حده که میاد براتون حوزه زمان و فرکانسو در واقع تشخیص میده تو عکسها شدتشو میگیره و الی آخر خب حالا فرض کنید ما یه عکس داریم که معادل عکس من علی را دیدم بوده و اون باید بیاد توکنهای من علی را دیدم و برام تولید کنه بچهها اینجا با باشید چون برام مهمه فرض کنید که دیتا ستی که من دارم ۱۰۰ تا کلمه داره مثلا فرض کنید که چه میدونم این حالا همینجوری به ذهنم خورد مثلاً این سیستم های ورودی پارکینگ هستن که عکس میگیرن از عکس چیز ماشین خودروی ماشین بعد بالا مینویسه ماشین فلان وارد شده خارج شد اون الان عکس گرفته به نوشته تبدیل کرده دیگه به تک تک توکن هاشو شکونده و اینجوریه که خب یه حدی داره دیگه مثلاً من الان ادعا کردم که فرض کنید دیتا چیز دایره لغات من صد تا کلمه داره و از این دیگه تخطی نمیکنه خب این ۱۰۰ تا رو دارم ولی جمله من علی را دیدم چیه مثلاً چند تا از اینا رو داره چهار تاشو داره از این ۱۰۰ تا این من علی عادی میافته اینه که چی شما اینو قرمزها رو ورودی میدید سبز میره یه هیدن حساب میشه و میره به آبی میده آبیه باید چند تایی میبود اگه مثلاً منی تو وان بود که بعدش من کلاسیفیکیشن کنم بگم چیه باید ۱۰۰ تایی میبود باید ۱۰۰ تایی بود که من برم اعتماد بگیرم یا گیریدی نگاه کنم و بدترینش بالاترینشو انتخاب کنم بگم منه دیگه الانم فرض کنید که این اتفاق میفته یعنی آبی و صورتی های که من کشیدم یه چیز ۱۰۰ تایی تولید کردن که از جنس احتمال و سافت مکس زدم جمعشون یک میشه و هرچی بالاتر باشن احتمالشو داره بالاتر میبینه و الی آخر خب برای اینکه با ctc کار بکنید اولین کار جنبی که انجام میدید اینه که تو فرایند ما ترینینگ رو تستمون یه تفاوت های داره تو ترینینگ اون من میدونم جوابش هست من علی را دیدم میام سطر من علی را و دیدمشو فقط جدا میکند اون چهار تا رو میکشم بیرون حالا یه لایه جدیدی به وجود میارم از چه رنگی استفاده نکردم مثلاً نارنجی خب یه لایهای به وجود میارم که این دفعه فقط چی داره چهار تا داره و احتمالهای تولید شده مربوط به جمله ترینینگمو میارم بالا به ازای هر ورودی بچهها من خروجی حتماً دارم با این حقهای که زدم که پرش کردم فضا رو درسته و حتما هم تعداد چند تا شد به تعداد توکن های موجود در جمله ترینینگم شد برای ترینینگ بعدی پنج تایی شد نارنجیم پنج تایی میشه خب حالا اینجا چی شده حالا اومدم احتمالات نه نه فقط میکشید بیرون هیچی در هیچ چیز ضرب نمیک من برداشتم از خوندن تئوری اینه که در هیچ چیز اما عین میکشینش بیرون دوباره هم سافت مک روش نمیزنید سابک زده شده قبلا فقط شما عددشو میکشید بیرون همین حالا میخویم بعداً یه لاسی تعریف کنم که بره ببینه این خوبه یا نه اون چهار تا عدده خوب در اومدن یا نه که خوب نیستند از اون طریق گرادیان رو اعمال کنه و w های چیزمو آپدیت کنه اول شده ممکنه خیلی بدی باشن درسته و حالا میخوام اینو ببرم جلو حالا احتمال اینا همه عددا از جنس احتمالا دیگه بین صفر تا یکی توی مثلاً معادله من هم توی چیز اول فریم اول هم تو فریم دوم تا تو فریم آخر وجود داره قبول دارید یا نه یعنی من الان یه جدول مثلاً اگه ۱۰ فریم داشته باشم ده در چهار نارنجی رنگ دارن اینو قبول دارید عالی خب این جایی بود که باید بهش میرسیدم من یه ۱۰ در چهار نارنجی جدا کردم حالا میخوام بیام رو سیتی سی صحبت کنم که اصلاً این چیه و باید چیکارش کنیم این ۱۰ در چهار رو و چجوری یه چیزی تعریف بکنم یه لاسی تعریف بکنم که بر اساس این ده در چاره بیاد وزنهای شبکهمون که تو بخشهای قرمز و سبز و آبی بوده رو اعمال بکنه و انشالله منو به جای خوبی برسونه تعداد ستونهای عکس مثلاً میتونه اون باشه اگر عکس تو یکی یکی ستون ستون بهش بدیم اگه دو ستون دو ستون دو ستون یعنی اومدی دو ستون دو ستون جدا کردی ولی دو ستونش زیر هم بردار کردی خب یه جور دیگه یه معنی دیگه میده درسته یه همچین چیزی اون در ساده ترین حالت فرض کن اکثر ستون ستون دادم بهش ورودی خب به یه جدول نارنجی مثلا چهار در تعداد فریم میرسم که اینا اعدادی که توش پر شده بین صفر تا یک اند درسته اگر فرض کنید ما تو نقطه خوب ماجراییم یعنی فرض کنید وزننا به اندازه کافی تو وزن شبکه خوب ترین شدن انتظارمون اینه که چه اتفاقی بیفته نه عدد نگاه این گوشه بالا سمت چپیه بین این چهار تا کدومش بالاتر باشه اون بالاتری منه بیشتر باشه یکی میرم جلوتر یا باید من باشم یا علی باشه نره را یا دیدم و پررنگ کنه با دوباره میرم سومی یا دوباره باید من باشم یا علی احسنت و یه اتفاقی که میفته یه الگوی این مدلی طوری مثلاً دربیاره فرض کنید بره پیدا کنه که مثلاً اولی و دومی من خیلی توش پررنگ بود سومی علی چهارمی تا هشتمی مثلاً راه و آخریش دهمی دیدم الان یه الگوی مجاز هست یا نیست ممکنه چیز باشه نه علی نه آها اگه اینو پیدا کنه تو ترینینگ که اولش که متداوله اون اشتباه میکنه و اصلا ممکنه تو شروع کنی اصلاً من بالا نباشه یعنی یه چیز دیگه بالاتر باشه و شما با لاس هی گرادیان میگیری هی میری آپدیت میکنی به این نقطه میرسه که چی این باید بیاد اصلاحش کنه تهش ولی باید شما رو به اون جمله من علی را دیدم برسونه یعنی الگو اگه خوب ترین شده باشه کجا داریم استفاده میکنیم حالا آقای رنجبر میاد براتون توضیح میده توی ترجمه جمله زبان اشاره فرض کنید که یه اخبار ناشنوایان طرف میاد یه جمله رو اجرا میکنه من میدونم جمله این بود که همین مثلا رئیس جمهور به فلان کشور سفر کرد خب ولی نمیدونم از کجا تا کجا رئیس جمهور بود و خیلی هم شاید برام نیار که بیام ببرم در سطح لغت لغت ولی هزاران تا از این جملات بهش میدن که مثلا رئیس جمهور رو تو ۱۰۰ تا ۲۰۰ تا جمله ببین حالا یه جا اول جمله یا وسط جمله ولی خودش بره پیدا کنه ببینه چی بود و این برام بیاد چیکار کنه پیدا کنه از این منظر به اینجور مسائل میگن ویک سوپروایز خب یعنی اینکه نه اصلا آن سوپروایز کامله نه کاملا سوپروایزه یه چیزی بینابین یعنی من جمله من علی را دیدم بهش گفتم ولی بهش نگفتم از کجا تا کجا من و فلانه خب حالا چیکار باید بکنیم بچهها اینجا دیگه یه سری موارد در واقع حاشیهای پیش میاد که من اجازه بدید رو مثال برم جلو خب و بعضیاشون ممکنه نیاز به بک گراند داشته باشه متوجه نشید و اگه نشدید هیچ ایراد نداره بهتون میگم از کجا برید مطالعه اول گذاشتم یعنی من اول گذاشتمش الان ولی بعدا که میخوام چیزشو آپدیت کنم رند لاس به اون آپدیت کنم میرم تو ستون های آبی صورتیه که جای علی واقعا پنجاهمیه آپدیت میشه آره ولی من به قول شما الان تو نارنجیم منو بالا گذاشتن چون چرا چون میخواستم این الگوی رخ بده یعنی الگوی ولیدی که از بالا گوشه سمت چپ شروع کنم به پایین سمت راست تمام بشه درسته بفرمایید تعریف نه نیست ممکنه تعداد فریمتون چیز نباشه مثال خودش زده گفته فرض کنید من کلمه بیفی رو میخواستم شناسایی کنم یعنی یه صوتی بوده توش گفتم بیفی و تو در حد فونیم مثلا آوای ب ای ف و ای رو باید برام پیدا میکرده عمداً هم تکراری هم داده یعنی مثلاً من میتونستم اینجوری بنویسم من علی را در کنار دوست علی دیدم یعنی عمدا دوتا علی توش بندازم این عمدا ای توش باشه خب گفته چیکار کنید همون حرف ما رو زده گفته یه شبکه دارید ورودی دارید قرمزه هیدنش رفته سبزه حساب شده رفته چی حساب کرده به ازای تعداد تمام کلمات دیکشنریتون یه خروجی حساب کرده شما دستی بیاید چی فقط بی فیش بکشید بیرون تا جدول نارنجی ما رو به وجود بیارید و در ضمن نباید بگید چون بیفی دو تا ی داره من یک بار میکشم نه دقیقا چون برام مهمه که این توکن شناسایی بشه باید به همون تعد فاصله انداخته اگه پشت سر هم بود چی مثلا فرض کن هلو میخوام اینو شناسایی کنه حالا اینم بهتون میگم چیکار کنیم فعلاً اینو گوشه ذهنتون بزارید آخرش یه تریک ساده است که توی حالا پیاده سازی هم بهتون میگیم خب کاری که کرده اینه که چی کاری که کرده اومده احتمالاتی که از شبکه پیدا کرده رو عیناً تو اون جدول بالایی که ما جدول نارنجی مون شد کپی کرده تا اینجا قبوله یا نه سوال در حد کلمه تشخیص بله در اینجا در حد آوا بوده من ممکنه آره دیگه الان کار که یوتیوب هست زیرنویس چیز بهتون میده آنلاین بهتون چیکار داره میکنه صوت داره میگیره در حد آوا یا در حد مثلا کلمه بهتون خروجی میده همه اینا شدنیه شما میتونید توکنتون چیه در حد آوا در حد کلمه دو تا من سه تا علی در واقع فرایند اسپکتور ستون اول من بوده از لحاظ زمانی معادل من هست چون من صوت من نگاه کن صوت من نه صوت من محور تیه دیگه صوت که ضبط میکنم بالاخره من وقتی میگم من علی را یعنی من اول منو میگم بعد علی رو میگم حالا به شبکه دارم میگم ببین تو برو پیدا کن دیگه خودت برو پیدا کن کجا من بوده زمانم مطرحه دیگه بله اصلا کلمه این سیتی مخفف چی بود کانکست تمرال کلاسیفیکیشن تمپرال معنی زمانی داره همون زمان چیز هم ترتیب اردر سینکرون دقیق یعنی رعایت میشه ولی فریم به فریم رعایت نمیشه اگه صوت شما ۱۰۰ فریم داشته باشه اینجوری نیست که از فریم یک باید یک یک آوا فریم دو یک آوا تولید شه ممکنه یه آوا به هر دلیلی سه فریم طول بکشه آره دیگه ارد بلوکهای صورتی رو اضافه کردن نه دیگه دوتاشون یکیه الان اون عددی که توی چیز پیدا شده تون برای ای دوبار کپیش میکنید هم تو سطر دوم هم تو سطر چهارم تو لحظه اول خب همون عین همونو گذاشته خب یه همچین چیزی نوشته نوشته وای صف الی آخر خب اوکی حالا میخواید اینو برید چیکار کنید یه یه کمک کنید به لاس فانکشن خب که قبلا هم تازه خودمون نزدیم که اینکه بیاد این مسیره رو بره پیدا کنه بچهها چندین راه اینجا وجود داره ما پارسال باید سال توی درسمون چهار پنج جلسه در مورد موضوعی به نام هیدن مارک گفت مدل یا صحبت کردیم که ورژن های غیر دیپ و قدیمی آرن بودن یعنی اونجا توش تو اونجا یه سری مفاهیم گفتیم که اگه دلتون میخواد با جزئیات بدونید یا این اسلایدها رو با جزئیات ترک کنید باید برید اون فیلمها رو ببینید که اگه خواستید من لینکاشو در اختیارتون قرار میدم ولی شاید نیارزه براتون الان لااقل توی بحبوحه مثلاً امتحانات و اینا و تو اونجا در مورد یه سری مباحث صحبت کردیم یکیش مثلاً موضوعی بود به نام روش ویتربی این کلمه رو به خاطر داشته باشید یا یکیش در مورد الگوریتم فوروارد بکوارد یا الگوریتم فوروارد الگوریتم جلو رو و عقب رو اینا اصطلاحاتی که من اونجا صحبت کردم اگه دلتون میخواد برید بپرسید بدید بخونید خب من باید در حد نیازتون الان بهتون میگم که انشالله بعدش بریم پیادهسازی عملیش ببینیم خب عرض به حضور شما اینکه تو روش ویتربی اتفاقی که میفته اینه که میگه ببین تو این ماتریس نارنجیه بالا رو داری خب میگه برو نگاه کن که چه مسیرهای مجازی وجود از ب شروع بشن به ای آخر ختم شه درسته مثلاً فرض کنید که سه تای اول ب باشه چهارمی و پنجمی ای باشه ششمی اف باشه بقیه اش ای آخر باشه این یه راه دوتای اول بی باشه ای بعداً مثلاً سه تا بعدی یکی بعدیش فلان درسته همه حالتها مجاز خیلی حالت خیلی حالت با یه الگویی به نام داینامیک پروگرمینگ میاد لایه لایه میره جلو میگه که خب من اگه بخوام همه حالت ها رو مستقل از هم فرض کنم کار طولانی میشه لایه لایه میره جلو و میگه برو احتمال مسیرهای مجاز رو برام پیدا کن مثلا فرض کنید هزار تا مسیر مجازه میره تمام اون هزار تا احتمالاشو میره محاسبه میکنه خب اگه لازم باشه و ماکسیممش مثلا فرض کن ۵ هزارمه مثلاً ماکسیمم احتمال اینکه یک مسیر از بی به ای ختم بشه واقعاً تو این اوردرم فکر نکنید مثلا ۲۰ درصد و ۵۰ درصد ایناست مثلاً ۵۰۰۰ خب |