عضویت در خبرنامه

به منظور دریافت آخرین بروزرسانی ها و محصولات، ایمیل خود را وارد بفرمایید.

اخبار داغ
محصولات

پست وبلاگ

اسکریپت پایتون (تحلیل سری زمانی)

امتیاز 0.00 از 5 بر اساس 0 دیدگاه کاربر
0 دیدگاه کاربر

99,000 تومان

  • پسوند فایل: py
  • حجم: 14 KB
  • زبان: برنامه نویسی پایتون
  • نرم افزار مورد نیاز: پایتون، Jupyter notebook

مناسب برای دانشجویان رشته های مهندسی و مدیریت، علاقه مندان به مباحث یادگیری ماشینی و هوش مصنوعی و برنامه نویسان پایتون

شناسه محصول SYN-03 دسته بندی برچسب , , ,

توضیحات

سری زمانی چیست؟

سری زمانی مجموعه ای از نقاط داده است که به ترتیب زمانی نمایش داده می شوند (یا لیست می شوند یا نمودار می شوند).

بنابراین، داده ها توسط خط های زمانی نسبتاً قطعی سازمان یافته اند و ممکن است در مقایسه با داده های نمونه تصادفی، حاوی اطلاعات اضافی باشند که می توانیم به آنها دسترسی پیدا کنیم.

محتویات اسکریپت محصول فایل پایتون پیوست که می تواند با نوتبوک ژوپیتر و یا کامپایلر پایتون باز شود را در ادامه بررسی می کنیم.

ابتدا به کتابخانه statsmodels نیاز خواهیم داشت، که دارای بسیاری از توابع مدل سازی آماری، از جمله سری های زمانی است. برای علاقه مندان R که مجبور به نقل مکان به پایتون شدند، مدل های stats قطعاً آشنا تر به نظر می رسند، چرا که از تعاریف مدل مانند “دستمزد ~ سن + آموزش” پشتیبانی می کند.

معیار های کیفیت پیش بینی

قبل از شروع پیش بینی، نحوه اندازه گیری کیفیت پیش بینی های را بررسی و نگاهی به معیارهای متداول می کنیم.

مربع R: ضریب تعیین (در اقتصاد سنجی، این را می توان به عنوان درصد واریانس توضیح داده شده توسط مدل تفسیر کرد)، (−∞، 1]

خطای مطلق: این یک معیار قابل تفسیر است چرا که واحد اندازه گیری همان سری اولیه را دارد، [0، + ∞]

خطای مطلق میانه: باز هم، یک معیار قابل تفسیر که به ویژه از نظر مقاومت در برابر داده های پرت بسیار جالب توجه است، [0، + ∞]

میانگین مربع خطا: متداول ترین موردی است که پنالتی بالاتری را برای خطاهای بزرگ تخصیص می دهد و بالعکس، [0، + ∞]

خطای لگاریتمی مربع میانگین: در عمل، این همان MSE است، اما ما لگاریتم سری را می گیریم. در نتیجه، ما به اشتباهات کوچک نیز وزن بیشتر می دهیم.

میانگین خطای درصد مطلق: این همان MAE است اما به صورت درصد محاسبه می شود، این معیار بسیار راحت است وقتی بخواهید کیفیت مدل را برای مدیریت توضیح دهید، [0، + ∞]

میانگین وزنی یک تغییر ساده در میانگین متحرک است. وزن های جمع شده تا 1 با وزن های بزرگتر که به مشاهدات اخیر اختصاص داده شده اند را شامل می شود.

اعتبارسنجی سری زمانی

قبل از شروع ساخت مدل، ابتدا در مورد چگونگی تخمین پارامترهای مدل به طور خودکار اسکریپت را توسعه داده ایم.

یک تابع خطا مناسب انتخاب می کنیم که به ما بگوید مدل چقدر به داده ها نزدیک است. سپس، با استفاده از اعتبار سنجی متقابل، تابع ضرر انتخابی خود را برای پارامترهای مدل داده شده ارزیابی خواهیم کرد، شیب را محاسبه می کنیم، پارامترهای مدل را تنظیم می کنیم و غیره، در نهایت به حداقل خطا می رسیم.

ممکن است شما بپرسید که چگونه اعتبار سنجی متقابل را برای سری های زمانی انجام دهید چرا که سری های زمانی دارای این ساختار زمانی هستند و نمی توان با حفظ این ساختار مقادیر را به صورت تصادفی در یک برابر مخلوط کرد. با تصادفی سازی، تمام وابستگی های زمانی بین مشاهدات از بین می رود. بنابراین در این مدل از Cross validation استفاده شده است.

توجه

Dataset های استفاده شده در اسکریپت در فایل zip در کنار اسکریپت پایتون قرار داده شده اند و باید آدرس ایمپورت آنها را در اسکریپت به روز کنید.

توضیحات تکمیلی

عنوان اصلی

Time Series python Script

فرمت فایل

py

دیتاست

همراه با محصول است