این پست به پنج قسمت تقسیم می شود. آنها عبارتند از: • چرا نیاز به عادی سازی در ترانسفورماتورها • Layernorm و اجرای آن • کرم لایه ای تطبیقی • هنجار RMS و اجرای آن • استفاده از لایه های عادی سازی داخلی Pytorch ، کیفیت مدل را در یادگیری عمیق بهبود می بخشد.
منبع: machinelearningmastery.com
