2. Қауіп факторының бағалау. Орайластық кестелерін түрлендіру. Фишердің нақты критерийі


Регрессия коэффициенттінің мәнділігін тексеру жорамалы



бет18/18
Дата16.09.2022
өлшемі0,55 Mb.
#149684
1   ...   10   11   12   13   14   15   16   17   18
Байланысты:
БСТ РК2
9 Құрал, ырғақтылық
19. Регрессия коэффициенттінің мәнділігін тексеру жорамалы.
Негізінде регрессиялық талдау – жауап айнымалының тәуелді мәнін бір немесе бірнеше тәуелсіз предикторлық айнымалылардың белгілі мәндері бойынша алдын - ала айтуға немесе бағалауға мүмкіндік беретін статистика бөлімі болып табылады. Тәуелді айнымалының орта мәні мен предикторлардың орта мәндері арасындағы өзара байланыс регрессия теңдеуі түрінде өрнектеледі.
Регрессия теңдеуінің коэффициенттері яғни a және b көлемі шектеулі таңдама деректері бойынша есептелгендіктен олардың мәнділігін бағалау қажеттілігі туындайды. Егер регрессия теңдеуінің a және b коэффициенттерінің екеуі де мәнді болатын болса, онда теңдеу ақырғы теңдеу делінеді. Ал егер коэффициенттердің арасында мәнді емесі бар болса, онда ол параметр теңдеуден алынып тасталады.
Бірінші Регрессия коэффициентінің (b) мәнділігін бағалауына келетін болсақ:
Бастапқыда Нөлдік және балама жорамалдарды анықтаймыз:
H0: айнымалылар арасындағы байланыстың сипаты регрессиялық емес, яғни ̂ b=0
H1: айнымалылар арасындағы байланыстың сипаты регрессиялық, яғни ̂ b≠0
Кейіннен Критерий статистикасын есептейтін боламыз. Ол үшін:
tбақылау =|b| / Sb
Бұл жерде еркіндік дәрежесінің саны df=n-2 тең Стьюденттің t таралуына бағынады, мұндағы Sb - b коэффициентінің стандарттық қатесі болып табылады.
Sb = қалдық / √∑(xi- ̅x)2
қалдық шамасы қалдық стандарттық ауытқу деп аталады (сәйкес, 2қалдық =  Y(a bx) / n  2 қалдық дисперсия) қалдық тәуелді және тәуелсіз айнымалылардың x, y стандарттық ауытқуларымен байланысты қалдық=√(n-1/n-2)*( 2y –b22x) формуласымен анықтаймыз. Мұндағы:
X  √ x2 (x)2 , Y  √ y2(y)2
Сонымен, Sb  (1/√ n1)*( қалдық/ x)
Содан соң Стьюдент таралуының сыни мәндері кестесінен берілген  мәнділік деңгейіне және df  n  2 сәйкес t,df сыни мәнін табатын боламыз.
Егер |t бакылау|  t сыни болса, онда P  , нөлдік жорамал жоққа шығарылады, яғни бас жиынтықта екі айнымалы арасындағы байланыс статистикалық мәнді (b  0)  .
Ең соғында Нәтижелерге қорытынды жасайтын боламыз.
Ал енді екінші тәсіліне келер болсақ. Регрессия коэффициентінің статистикалық шынайылығын сенім аралықтарын қолданып анықтауға болады. (b) үшін 100(1) пайызды сенім аралығы b t Sb b b t Sb түрінде анықталады.
Егер сенім аралығына нөл кірмесе, онда ̂b=0 болу ықтималдығы α% -дан кем болады.
Екінші Регрессия теңдеуінің бос мүшесі a коэффициентін мәнділікке тексеру үшін t  |a|/ Sa статистикалық критерийі қолданамыз.
t – еркіндік дәрежесі df  n  2 болатын Стьюденттің t таралуына бағынады. Мұндағы Sa-a коэффициентінің стандарттық қатесі.
Sa калдык √ (1/ n)  x2 / (n 1) 2x формуласымен есептеледі.
Әрі қарай есептеулер b коэффициенті үшін жасалған есептеулерге ұқсас.
α коэффициенті үшін 95% сенім аралығы:
a t0,05 Sa  а  a  t 0,05 Sa
түрінде анықталады.
Қорытындылар болсам, негізі регрессиялық талдаудың моделі: yi=a+bxii мұндағы i= 1,2,…,n түрінде болып келеді. Ал a-y бойынша ығысуды сипаттайтын параметр, b- регрессия коэффициенті, функция графигінің Х бойынша ығысуын сипаттайтын параметр, εi - кездейсоқ айнымалының корреляциялық тәуелділікпен байланыспаған қателіктері болып табылады. Регрессиялық талдауда b регрессия коэффициентінің және a бос мүшесінің мәнділігі туралы жорамалын тексереді.
20.Статистикалық қолданбалы бағдарламалардың түрлері мен мүмкіндіктері.
Орындалатын жұмыстың тиімділігі ол қолданылатын бағдарламалармен тығыз байланысты. Әдетте, статистикадағы көптеген кестелік процессорларда жасайды, олардың көп бөлігі MS Excel -ді қолданады. Жалпы алғанда,барлық ғылыми математикалық қосымшаларды екі үлкен топқа бөлуге болады: графикалық интерфейсі бар және интерфейсі жоқ бағдарламалар. Графикалық интерфейс қандай да бір түрде бағдарламалық өнімнің сапасын сипаттамайды.Осы қасиеттер бір-біріне тәуелді емес. Алайда, мұндай бөлудің практикалық маңызы зор.
Алдымен біз статистикалық есептеу ортасымен және R жүйесінде статистикалық мәліметтерді өңдеуге, соның ішінде графикамен жұмыс істеуге кең мүмкіндіктер бар, ал терезе интерфейсін қосымша ретінде орнатуға болады. R ортасын Windows, MacOS немесе Linux жұмыс істейтін компьютерге орнатуға болады. R сенімділігі оның пайда болуымен түсіндіріледі. Тіл өте қуатты s бағдарламалау тілін еркін енгізу ретінде құрылды, оның тарихы 1976 жылы, алғашқы жұмыс нұсқасы пайда болған кезде басталды. Бүгінгі таңда s тілі TIBCO Software Inc. әзірлеген S-PLUS қосымшасының негізі болып табылады.. және R-ден айырмашылығы-бұл коммерциялық өнім. S-PLUS жағымды графикалық интерфейске ие, оған деректерді сыртқы файлдан, дерекқордан жүктеу немесе кестені мәтіндік файлдан немесе кесте процессорынан көшіру арқылы енгізуге болады. S-PLUS, R сияқты, әртүрлі операциялық жүйелерде жұмыс істей алады және сандық немесе графикалық талдау әдістерін орындау үшін қолданылады.Тағы бір танымал статистикалық қосымша-ХХ ғасырдың 60-жылдарында Солтүстік Каролина университетінде ауылшаруашылық зерттеулерінің нәтижелерін талдауға арналған қосымша ретінде пайда болған SAS жүйесі. Бүгінгі таңда жүйе осы бағдарламаның тоғызыншы нұсқасын шығарған SAS Institute компаниясында дамуды жалғастыруда. SAS қолдану саласы-әртүрлі ғылыми зерттеулер, бизнес-аналитика және т. б.
1993 жылдан бастап бельгиялық medcalc Software компаниясы әзірлеген MedCalc бағдарламасы биомедициналық зерттеушілердің қажеттіліктеріне сәйкес жасалған толыққанды статистикалық қосымша ретінде орналастырылған. Әзірлеушілер зерттеушілердің назарын Roc қисықтарын талдау үшін MedCalc қолданудың ыңғайлылығына аударады.Бағдарлама ыңғайлы болып табылады, өйткені ол артық функционалдылықты ұсынбайды, бұл көбінесе әмбебап қосымшалармен жұмыс істей бастайтын дайын емес адамды шатастырады. MedCalcl - бұл қарапайым және қолдануға оңай бағдарлама, бірақ кез-келген қолданушы одан жұмыс істеу үшін қажет нәрсенің бәрін ала алмайды. Статистикалық бағдарламаларға өте жоғары талаптар қоятындарға , Statistica немесе SPSS Statistics сияқты қосымшалар танымал. Екі бағдарлама да MedCalc - пен салыстырғанда нақты болып табылады.Бүгінгі таңда соңғы нұсқа-Statistica 9. SPSS бағдарламасы, оның атауы әлеуметтік ғылымдарға арналған статистикалық пакеттің аббревиатурасы, жақында IBM компаниясына тиесілі болды және атауын PASW (Predictive Analytics SoftWare) Statistics деп өзгертті. Екі бағдарламада да керемет графикалық интерфейс бар, сонымен қатар кіріктірілген бағдарламалау тілі және R статистикалық есептеу тілімен біріктіру мүмкіндігі бар.
Айта кету керек, осы құралдармен қамтамасыз етілген статистикалық өңдеудің шексіз мүмкіндіктері компьютерден үлкен ресурстарды қажет етеді. Сонымен, SPSS жұмыс істеуі үшін сізге кемінде 1 Гб жедел жад қажет. SPSS-ті іске қосуға болатын операциялық жүйелер: Windows, MacOS және Linux. Statistica тек Windows үшін жасалған, бұл оның пайдаланушыларының санын біршама азайтады. Ол жердег біріктірілген кесте процессоры әр қолданушыға таныс кеңсе қосымшаларын қолдана отырып кестелер жасауға мүмкіндік береді. Сақталған кестелерді, сондай-ақ есептеулердің нәтижелерін, графиктерді және Statistica есептерін "жұмыс кітабы" деп аталатын бір файлға ыңғайлы түрде орналастыруға болады, ал SPSS-те жұмыс кеңістігін ұйымдастыру онша ыңғайлы емес, бірақ қысқа бейімделу кезеңінен кейін қолдануға болады.Бағдарламаларда барлық бізге танымал статистикалық әдістер бар: жиілікті талдау, статистикалық сипаттамаларды есептеу, конъюгация кестелері, корреляциялар, графиктер, t-тесттер және параметрлік емес өлшемдердің көп саны, көп өлшемді сызықтық регрессиялық талдау, дискриминантты талдау, факторлық талдау, кластерлік талдау, дисперсиялық талдау, сенімділікті талдау, көп өлшемді масштабтау және тағы басқалар.
STATISTICA және SPSS жүйелері кең графикалық мүмкіндіктерге ие. Олар графиктердің көптеген санаттары мен түрлерін, соның ішінде әртүрлі координаттар жүйелеріндегі ғылыми, үш өлшемді және екі өлшемді графиктерді, мамандандырылған статистикалық графиктерді — гистограммаларды, матрицаларды, санатталған графиктерді және т. б. қамтиды.
Кластерлік талдау - бұл көп факторлы статистикалық талдау әдістерінің бірі, көптеген факторлармен сипатталатын элементтер жиынтығын және біртекті топтарды құруға арналған. Кластерлік талдаудың міндеті - элементтер туралы бастапқы ақпаратты қысылған түрде оны жоғалтпай ұсыну. STATISTICA кластерлік талдаудың бірнеше әдісін ұсынады. Болашақта біз біріктіруді қолданамыз (ағаш кластері) - егер кластерлер саны белгісіз болса, осы жағдайда қолданылатын иерархиялық әдістер тобы бар (7 түрі). Қолданылатын әдіс - бұл Уорд әдісі, ол элементтердің аз санымен жақсы жұмыс істейді және шамамен бірдей мүшелері бар кластерді таңдауға бағытталған. Қашықтыққа арналған метрика ретінде пакет әртүрлі шараларды ұсынады, бірақ ең көп тарағаны - эвклидтік қашықтық. STATISTICA-да элементтерді кластерлеу кезінде кейстер (жолдар) режимін таңдаймыз,ал кластерлеу кезінде факторлар: айнымалылар (бағандар) болып табылады.
Қорыта айтатын босақ,көріп отырғанмыздай, әлем бойынша статистикалық талдауға арналған көптеген қосымшалар бар. Олардың аз ғана бөлігін қысқаша сипаттап кеттік. Оның сыртында Minitab, MatLab, Octave, GenStat, JMP, Analyse-it, STADIA және басқа да көптеген үлкен және кіші, қымбат және ақысыз бағдарламалар өте көп . Алайда, мұндай бағдарламалардың көп болуы зерттеушіні қорқытпауы керек, бір немесе екі бағдарламаның пайдасына ойластырылған таңдау жасау, оларды қолданудың қыр-сырын мұқият зерделеу қажет.Сонымен қатар,осы түрлі бағдарламалдың нәтижелері статистикалық талдауда көптеген уақыт бойы адал көмекші болады деп айта аламыз.

Достарыңызбен бөлісу:
1   ...   10   11   12   13   14   15   16   17   18




©www.engime.org 2024
әкімшілігінің қараңыз

    Басты бет