یک مدل پیش بینی بازار سهام با ترکیب تجزیه و تحلیل مؤلفه اصلی دو بعدی دو جهته و شبکه عصبی عملکرد پایه شعاعی

ساخت وبلاگ

در این مقاله ، ما یک مدل ترکیبی را ترکیبی از تجزیه و تحلیل مؤلفه اصلی دو بعدی دو بعدی ((2D) 2 PCA) و یک شبکه عصبی عملکردی پایه شعاعی (RBFNN) برای پیش بینی رفتار بازار سهام پیشنهاد و پیاده سازی می کنیم. اول ، 36 متغیر فنی بازار سهام به عنوان ویژگی های ورودی انتخاب می شوند و از یک پنجره کشویی برای به دست آوردن داده های ورودی مدل استفاده می شود. در مرحله بعد ، (2D) 2 PCA برای کاهش ابعاد داده ها و استخراج ویژگی های ذاتی آن استفاده می شود. سرانجام ، یک RBFNN داده های پردازش شده توسط (2D) 2 PCA را برای پیش بینی قیمت یا حرکت سهام روز بعد می پذیرد. مدل پیشنهادی در شاخص بورس سهام شانگهای استفاده می شود و آزمایشات نشان می دهد که این مدل به سطح خوبی از تناسب اندام دست می یابد. سپس مدل پیشنهادی با مدل که از روش کاهش ابعاد سنتی استفاده می کند ، تجزیه و تحلیل مؤلفه اصلی (PCA) و تجزیه و تحلیل مؤلفه مستقل (ICA) مقایسه می شود. نتایج تجربی نشان می دهد که مدل پیشنهادی از مدل مبتنی بر PCA و همچنین مدل های جایگزین مبتنی بر ICA و بر Perceptron چند لایه بهتر عمل می کند.

استناد: Guo Z ، Wang H ، Yang J ، Miller DJ (2015) مدل پیش بینی بازار سهام با ترکیب تجزیه و تحلیل مؤلفه اصلی دو بعدی دو بعدی و شبکه عصبی عملکرد پایه شعاعی. PLOS ONE 10 (4): E0122385. https://doi.org/10. 1371/joual. pone. 0122385

ویراستار دانشگاهی: بوریس پودوبنیک ، دانشگاه رجکا ، کرواسی

دریافت: 25 سپتامبر 2014 ؛پذیرفته شده: 21 فوریه 2015 ؛منتشر شده: 7 آوریل 2015

این یک مقاله دسترسی آزاد است ، عاری از همه حق چاپ ، و ممکن است آزادانه بازتولید ، توزیع ، انتقال ، اصلاح شده ، ساخته شده ، ساخته شده یا در غیر این صورت توسط هر کسی برای هر منظور قانونی استفاده شود. این کار تحت فداکاری دامنه عمومی Creative Commons CC0 در دسترس است

در دسترس بودن داده ها: کلیه داده های مربوطه در داخل مقاله و پرونده های اطلاعاتی پشتیبانی آن قرار دارند.

بودجه: این کار تا حدی توسط بنیاد ملی علوم طبیعی چین (شماره کمک مالی 51479159) و بنیاد ملی علوم طبیعی استان هوبی ، چین پشتیبانی می شود (شماره کمک مالی 2014CFB868).

منافع رقابتی: نویسندگان اعلام کرده اند که هیچ منافع رقابتی وجود ندارد.

معرفی

در سال های اخیر، موضوع مهمی در تصمیم گیری سرمایه گذاری/مالی بوده و در حال حاضر مورد توجه قابل توجه جامعه پژوهشی قرار گرفته است [1]. بازار سهام کاملاً جذاب است اگر بتوان رفتار آن را پیش بینی کرد. با این حال، پیش بینی شاخص بورس به دلیل ویژگی حرکت تصادفی آن، کار دشواری تلقی می شود. بر اساس فرضیه بازار کارا [2]، تغییرات قیمت‌های بازار سهام توسط اطلاعات جدید تعیین می‌شود، اما به دلیل غیرقابل پیش‌بینی بودن اطلاعات جدید، قیمت بازار سهام نیز غیرقابل پیش‌بینی است. برخی از محققان استدلال می کنند که همانطور که در مطالعات Los [3] و Haugen [4] گزارش شده است، می توان بازار سهام را در کوتاه مدت پیش بینی کرد. بازار سهام چین اکنون پس از ژاپن، دومین بازار بزرگ در آسیا است. گوو [5] نشان داد که بازار سهام چین از سال 2002 به تدریج به عنوان فشارسنج اقتصاد عمل می کند. بازار سهام شانگهای در سال 1991 افتتاح شد که نقش مهمی در توسعه اقتصادی چین ایفا می کند، بنابراین تعداد فزاینده ای از مدل های پیش بینی در حال انجام است. توسعه یافته برای پیش بینی روند بازار سهام شانگهای. این مطالعات قبلی در Cao و همکاران گزارش شده است.[6]، یانگ و همکاران.[7]، ژانگ و همکاران.[8]، دای و همکاران [9]و یه و همکاران[10].

در طول دو دهه گذشته، بسیاری از مدل‌های مبتنی بر محاسبات نرم پیشنهاد شده‌اند [11-16]. در بیشتر رویکردهای پیش‌بینی موجود، مطالعات متعددی با استفاده از RBFNN برای پیش‌بینی قیمت سهام انجام شده است. RBFNN برای اولین بار برای حل مسئله درونیابی برازش منحنی دقیقاً از طریق مجموعه ای از نقاط استفاده شد [17]. ورساچه و همکاران[18] از مخلوطی از RBFNN ها برای ارزیابی عملکرد ترکیبی ناهمگن از الگوریتم های شبکه عصبی برای پیش بینی DIA صندوق قابل معامله در بورس (AMEX Ticker: DIA) استفاده کرد. وانگ و همکاران[19] بعد فراکتالی بازار سهام شانگهای را از طریق یک الگوریتم تقریب تابع بر اساس RBFNN به دست آورد. سان و همکاران[20] یک مدل پیش بینی شاخص مالی بر اساس یک RBFNN اصلاح شده برای یافتن نقاط مهم شاخص سهام پیشنهاد کرد. تعداد زیادی از برنامه های کاربردی موفق نشان داده اند که RBFNN به دلیل توانایی آنها در تقریب هر تابع پیوسته با دقت دلخواه می تواند تکنیک های مفیدی برای پیش بینی قیمت سهام باشد. از آنجایی که RBFNN دارای همگرایی سریع است، اما توانایی حل مسئله غیرخطی قدرتمندی دارد. انگیزه این مطالعه استفاده از RBFNNN برای پیش‌بینی قیمت سهام است.

هنگام استفاده از RBFNN برای پیش بینی قیمت سهام ، مقادیر اصلی مشاهده شده متغیرهای پیش بینی معمولاً برای ساخت مدل های پیش بینی مستقیماً استفاده می شود. یکی از مشکلات مهم ، نویز ذاتی مقادیر اصلی است که بر عملکرد پیش بینی تأثیر می گذارد. بسیاری از مطالعات در مورد تجزیه و تحلیل سری زمانی نشان داده اند که پیش پردازش داده های خام برای بهبود عملکرد سیستم و تعمیم مدل به داده های غیب مفید و ضروری است. برای پیش بینی بازار سهام ، با به دست آوردن داده های جدید ، اگر مدل پیش بینی کننده قابل تصحیح باشد تا آن را به حساب آورد ، باید مدل بهتر برای داده های جدید سازگار شود و باید دقت پیش بینی کننده آن بهبود یابد. بنابراین ، به ویژه برای پیش بینی بازار سهام ، با نوسانات ذاتی آن ، مدل پیش بینی کننده باید به صورت پویا به صورت آنلاین آموخته شود. در این زمینه یادگیری ، ابعاد داده های خام نقش مهمی در بهبود عملکرد و کاهش پیچیدگی محاسباتی مورد نیاز برای یادگیری مدل پیش بینی دارد. در این حالت ، بسیاری از روش های سیستم ترکیبی برای بهبود عملکرد سیستم های پیش بینی بازار سهام پیشنهاد شده است [21-23]. این روشهای موجود معمولاً شامل دو مرحله هستند ، مرحله اول استخراج ویژگی برای از بین بردن نویز است ، مرحله دوم پیش بینی کننده پیش بینی قیمت سهام است.

Atsalakis و همکاران.[22] خاطرنشان كردند كه همه مقالات جزئیات پیش پردازش داده ها را ارائه نمی دهند ، یا در واقع آیا از پیش پردازش استفاده می شود. این نشان می دهد که باید به روشهای پیش پردازش مورد استفاده در پیش بینی بازار سهام توجه بیشتری شود. به طور خاص ، برای بهبود عملکرد مدل پیش بینی باید روشهای کاهش ابعاد مؤثرتر معرفی شود. رویکردهای متداول شامل عادی سازی داده ها ، کاهش شاخص و PCA [24] ، یک روش تجزیه و تحلیل فرعی بسیار محبوب است که با موفقیت در بسیاری از حوزه ها برای کاهش ابعاد استفاده می شود. Ajithet و همکاران.[23] از PCA برای پیش بینی داده های خام برای پیش بینی بازار سهام استفاده کرد ، اما جزئیات را ارائه نداد. هوانگ و همکاران.[25] مدلی را بر اساس PCA و BPNN پیشنهاد کرد تا روند قیمت آینده را پیش بینی کند ، و موارد واقعی را آزمایش کرد تا اعتبارسنجی کند که عملکرد PCA+BPNN نسبت به یک شبکه عصبی استاندارد ارجح است. راوی و همکاران.[26] با ترکیب PCA و RBFNN برای ساخت یک سیستم پیش بینی عملکرد بانکی ، یک مدل فیوژن را پیشنهاد و پیاده سازی کرد. Tsai [27] از PCA به عنوان یک روش انتخاب ویژگی پیش بینی سهام استفاده کنید. یکی دیگر از رویکردهای مشهور ICA است. هوانگ و همکاران.[28] یک مدل پیش بینی را پیشنهاد کرد که ICA و RBFNN را برای پیش بینی روند در نرخ ارز واقعی ترکیب کرده است. هوانگ [29] ، Guo [30] و Yeh [31] با ترکیب ICA و SVR در انجام وظایف پیش بینی سری زمانی ، یک مدل ترکیبی را پیشنهاد کردند. در این روش ها ، از PCA یا ICA به عنوان ابزار پیش پردازش قبل از ساخت یک مدل پیش بینی سهام استفاده شده است.

PCA یا ICA مناسب است وقتی که قالب داده های خام یک بردار با ابعاد پایین تر است. با این حال ، این شرط اغلب از پیش بینی سهام راضی نیست. در سیستم های پیش بینی چند متغیره ، بین متغیرها یک ارتباط قوی وجود دارد و قالب اولیه داده های خام یک تنش است. به عنوان ابزارهای استخراج ویژگی ، هم PCA و هم ICA نیاز به تبدیل تانسور به یک بردار دارند که شامل دو اشکال است. یکی این است که به پیچیدگی محاسباتی ممنوع نیاز دارد ، دیگری PCA و ICA همبستگی ساکن در داده های خام را شکست. در این مطالعه ، یک روش زیر فضای تانسور ، (2D) 2 PCA [32] مبتنی بر طرح denoising مبتنی بر ارائه و یکپارچه سازی با RBFNN برای ساختن یک مدل پیش بینی قیمت سهام (به نام (2D) 2 PCA+RBFNN مدل). در این کار ، ابتدا از یک پنجره کشویی و 36 متغیر تکنیک برای به دست آوردن بازنمایی چند بعدی از متغیر پیش بینی استفاده شد. دوم ، (2D) 2 PCA برای استخراج ویژگی ها از متغیرهای پیش بینی کننده استفاده شد. سوم ، از این ویژگی ها به عنوان ورودی های RBFNN استفاده شد. ما به تأثیر کاهش ابعاد بر عملکرد سیستم پیش بینی اهمیت می دهیم. مدل پیشنهادی (2D) 2 PCA+RBFNN استفاده (2D) 2 PCA برای حذف نویز از داده های خام ورودی ، این ویژگی حاوی اطلاعات سر و صدای کمتری خواهد بود و به عنوان ورودی RBFNN برای پیش بینی مقدار یا حرکت بعدی عمل می کند. قیمت بسته شدن روز. مقایسه با PCA و ICA ، (2D) 2 PCA ، همانطور که در این مقاله نشان داده شده است ، پیش پردازش محاسباتی کارآمد و استخراج ویژگی های قدرتمندتر را ارائه می دهد و منجر به پیش بینی دقیق تر می شود.

در مطالعات قبلی ، بازارهای مختلف سهام مدل شده است. برخی از محققان روی سهام متمرکز شده اند ، در حالی که برخی دیگر توجه بیشتری به شاخص بورس اوراق بهادار کرده اند که این نشان دهنده میانگین حرکت بسیاری از سهام های فردی است. در مقایسه با یک سهام واحد ، شاخص بازار سهام در بازتاب حرکت کلی بازار نسبتاً پایدار است. شاخص بورس سهام شانگهای جمع آوری شده از بازار سهام چین برای نشان دادن مدل دو مرحله ای پیشنهادی استفاده می شود. عملکرد پیش بینی رویکرد پیشنهادی با سایر روشهای جایگزین مقایسه می شود: ادغام PCA با RBFNN (به نام PCA+RBFNN) ، ICA با RBFNN (به نام ICA+RBFNN) ، PCA با BPNN (به نام PCA+BPNN) و ICA با BPNN(به نام ICA+BPNN). مقایسه مدل نشان می دهد که رویکرد پیشنهادی نسبت به سایر مدلهای جایگزین عملکرد بهتری دارد.

بقیه این مقاله به شرح زیر سازماندهی شده است. در بخش 2 ، ما یک نمای کلی از (2D) 2 PCA و RBFNN ارائه می دهیم. مدل پیشنهادی در بخش 3 ارائه شده است. در بخش 4 ، آزمایشات برای ارزیابی عملکرد مدل پیشنهادی انجام می شود. نتیجه گیری در بخش 5 آورده شده است.

روش تحقیق

در این بخش ، ما به طور خلاصه مفاهیم اساسی در مورد فن آوری های اساسی مورد استفاده در مطالعه را مرور می کنیم.

PCA یک روش کاهش ابعاد شناخته شده است که در تشخیص الگوی و پردازش سیگنال استفاده می شود. با توجه به نمونه n نمونه a = a1، آ2، ··· ، آحرف>با نمونه i -منیک ماتریس m × n ، یکی تبدیل می شودمنبه یک بردار 1D Xمنستون به ستون یا ردیف به صورت ردیف ، جایی که xمنیک بردار ستون MN × 1 است. ماتریس پراکندگی کل همه نمونه ها به شرح زیر تعریف شده است: (1) در اینجا ، میانگین x استمنبشربردار اصلی PCA ، ویژه ای است که مربوط به حداکثر مقادیر ویژه C است. به طور کلی ، داشتن یک بردار بهینه بهینه کافی نیست ، بنابراین بردار تبعیض آمیز Vداز مجموعه ویژه های متعامایی C مربوط به اولین مقادیر ویژه D تشکیل شده است. وکتور ویژگی حاصل برای xمنy استمنبه دست آمده با طرح xمنبه فضای زیر Vد، یعنی

تنظیم یک آستانه θ ، D می تواند به عنوان کمترین تعداد ابعاد رضایت بخش های زیر انتخاب شود: (3) از موارد فوق ، می بینیم که برخی از مضرات PCA وجود دارد. ابتدا نمونه از یک بردار 2D به یک بردار 1D طولانی تبدیل می شود ، که ساختار مکانی ماتریس اصلی را می شکند. حفظ این ساختار 2D ممکن است هنگام تبدیل داده ها به استخراج ویژگی ها از اهمیت ویژه ای برخوردار باشد. دوم ، و شاید مهمتر از همه ، به دلیل ابعاد بالا ، با توجه به یک مجموعه آموزش محدود ، ارزیابی دقیق ماتریس کواریانس C ممکن است دشوار باشد. سرانجام ، زمان پردازش گرفته شده توسط PCA ممکن است ممنوع باشد. برای غلبه بر این مشکلات ، یانگ و همکاران.[33] تجزیه و تحلیل مؤلفه اصلی دو بعدی (2DPCA) را پیشنهاد کرد که با موفقیت در تشخیص چهره مورد استفاده قرار گرفت.

(2d) 2 PCA

در (eq 4) ، میانگین همه نمونه ها است. می توان مقادیر ویژه λ را محاسبه کردمنو eigenveector vمناز sحرفبشربر این اساس ، زیر فضای V در حال پیش بینیداز eigenvectors های متعامد تشکیل شده است1، v2، · · · ، vداز sحرفمربوط به اولین مقادیر ویژه D. ماتریس ویژگی 2DPCA با طرح ریزی a به دست می آیدمنبه فضای زیر Vدو اندازه yمنn × d است.

در الگوریتم 2DPCA ، اندازه ماتریس کواریانس SحرفM × M ، بسیار کوچکتر از PCA است. به همین دلیل ، پیچیدگی محاسباتی 2DPCA به مراتب کمتر از PCA است. در عین حال ، زیرا ماتریس کواریانس توسط a ساخته شده استمن، اطلاعات ساختار مکانی در پردازش حفظ می شود. با این حال ، نقطه ضعف اصلی 2DPCA این است که مقادیر ویژگی اغلب بسیار بزرگتر از PCA است. علاوه بر این ، برخی از مطالعات نشان می دهد که 2DPCA اساساً در جهت ستون ماتریس کار می کند ، یعنی ویژگی های ماتریس را فقط در جهت ستون استخراج می کند. اطلاعات موجود در جهت ستون با هم مرتبط نیست ، اما اطلاعات موجود در جهت ردیف هنوز پس از تحول در ارتباط است. ژانگ و همکاران (2005) یک روش دو بعدی دو بعدی به نام (2D) 2 PCA را برای حل این مشکل پیشنهاد کردند.

فرض کنید ماتریس پیش بینی Vدبه دست آمده استماتریس M × N را پروژه کنیدمنبه vدبرای به دست آوردن ماتریس ویژگی N × D. سپس yمنبه بازده منتقل می شود. پس از آن ، به عنوان نمونه جدید آموزشی که دوباره می توان 2DPCA را انجام داد (به نام Alteatve 2DPCA) ، ماتریس ویژگی Z را به دست آوردمن، اگر eigenvectors در گزینه های جایگزین 2DPCA انتخاب شده باشد تا فضای زیر را تشکیل دهدپ، الگوریتم (2D) 2 PCA را می توان به شرح زیر توصیف کرد:

اندازه ZمنD × P است ، از D و P ، در مقایسه با تحولات جایگزین ، ابعاد این ماتریس به طور قابل توجهی کاهش می یابد. از فرمول (5) می بینیم که ایده اصلی (2D) 2 PCA این است که ماتریس اصلی aمنبرای استخراج ویژگی Row Direction y در یک فضای زیر 2DPCA پیش بینی شده استمن، سپس به عملکرد منتقل می شود و از 2DPCA جایگزین برای استخراج ویژگی جهت ستون استفاده می شود. بنابراین ، ماتریس ویژگی Zمنحاوی هر دو Row Direction و Column Direction Feather از ماتریس اصلی است. مجموعه ویژگی های به دست آمده از 2DPCA به طور کلی بسیار بالاتر از (2D) 2 PCA است. بنابراین از دیدگاه کاهش ابعاد ، عملکرد 2DPCA بسیار بدتر از (2D) 2 PCA است. برای سیستم های پیش بینی سهام آنلاین ، اگر 2DPCA (به جای (2D) 2 PCA) به عنوان ابزاری برای پردازش داده های خام استفاده شود ، پس پیچیدگی آموزش مدل به شدت افزایش می یابد. برای اطلاعات بیشتر ، لطفاً به [32] مراجعه کنید.

rbfnn

ایده RBFNN [30] از تئوری تقریب عملکرد ناشی می شود. RBFNN دارای یک ساختار سه لایه است: لایه ورودی ، لایه پنهان و لایه خروجی. لایه ورودی داده های ورودی را به هر گره از لایه پنهان جمع آوری و تغذیه می کند. گره های پنهان مجموعه ای از توابع پایه شعاعی را اجرا می کنند که اغلب به عنوان توابع گاوسی انتخاب می شوند. لایه خروجی یک تابع جمع بندی خطی وزنی را برای جمع آوری خروجی های لایه پنهان برای به دست آوردن مقدار پیش بینی (که ممکن است آستانه شود ، در صورت جستجوی تصمیم باینری) پیاده سازی می کند. معماری RBFNN در شکل 1 نشان داده شده است.

پایگاه های معاملاتی...
ما را در سایت پایگاه های معاملاتی دنبال می کنید

برچسب : نویسنده : فرشته صدرعرفایی بازدید : 45 تاريخ : يکشنبه 6 فروردين 1402 ساعت: 0:28