Hội tụ theo xác suất đối với ước lượng mô hình hồi quy phi tham số với sai số ngẫu nhiên độc lập đôi một và có xác suất đuôi nặng
Trong bài báo này, chúng tôi nghiên cứu sự hội tụ theo xác suất đối với ước lượng của mô hình hồi quy phi tham số với sai số ngẫu nhiên độc lập đôi một, có xác suất đuôi nặng. Đầu tiên, chúng tôi sử dụng lý thuyết hàm biến đổi chậm thiết lập luật số lớn đối với dãy biến ngẫu nhiên độc lập đôi một, có xác suất đuôi nặng. Áp dụng kết quả thu được, chúng tôi thiết lập hội tụ theo xác suất của ước lượng của mô hình hồi quy phi tham số. Ví dụ minh họa và mô phỏng cũng thu được hội tụ theo xác suất đối với phương pháp ước lượng láng giềng gần nhất

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7
Bạn đang xem tài liệu "Hội tụ theo xác suất đối với ước lượng mô hình hồi quy phi tham số với sai số ngẫu nhiên độc lập đôi một và có xác suất đuôi nặng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Hội tụ theo xác suất đối với ước lượng mô hình hồi quy phi tham số với sai số ngẫu nhiên độc lập đôi một và có xác suất đuôi nặng
on and Science
cKhoa Toán, Trường Đại học Sư phạm - Đại học Đà Nẵng
dScience & International cooperation Department, the University of Da Nang - Da Nang University of Education
and Science
dPhòng Khoa học & Hợp tác Quốc tế, Trường Đại học Sư phạm - Đại học Đà Nẵng
(Ngày nhận bài: 30/01/2021, ngày phản biện xong: 18/03/2021, ngày chấp nhận đăng: 25/03/2021)
Abstract
In this paper, we study convergence in probability for the estimator of nonparametric regression model based on
pairwise independent errors with heavy tails. Firstly, we investigate laws of large numbers for sequences of pairwise
independent random variables with heavy tails. By applying this result, we investigate convergence in probability for
the estimator of nonparametric regression model. Simulations to study the numerical performance of the consistency for
the nearest neighbor weight function estimator in nonparametric regression model are given.
Keywords: Pairwise independence; nonparametric regression; laws of large numbers; the nearest neighbor.
Tóm tắt
Trong bài báo này, chúng tôi nghiên cứu sự hội tụ theo xác suất đối với ước lượng của mô hình hồi quy phi tham số với
sai số ngẫu nhiên độc lập đôi một, có xác suất đuôi nặng. Đầu tiên, chúng tôi sử dụng lý thuyết hàm biến đổi chậm thiết
lập luật số lớn đối với dãy biến ngẫu nhiên độc lập đôi một, có xác suất đuôi nặng. Áp dụng kết quả thu được, chúng tôi
thiết lập hội tụ theo xác suất của ước lượng của mô hình hồi quy phi tham số. Ví dụ minh họa và mô phỏng cũng thu
được hội tụ theo xác suất đối với phương pháp ước lượng láng giềng gần nhất.
Từ khóa: Độc lập đôi một; hồi quy phi tham số; luật số lớn; láng giềng gần nhất.
1 This research is funded by the Vietnam Ministry of Education and Training (MOET) under the grant no. B2020-DNA-9
Corresponding Author: Le Van Dung; Faculty of Mathematics, the University of Da Nang - Da Nang University of
Education and Science
Email: lvdung@ued.udn.vn
52 T.D. Xuan, N.T.Quyen, N.T.T.An,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 51-57
1. Introduction where Wni()(,,) x W x x n1 x nn are weighted
functions.
Let {Xnn ; 1} be a sequence of random
variables defined on a fixed probability space The above estimator was first proposed by
( , ,P ), {ani ;1 i n , n 1} be a triangle Stone [11], then Georgiev et al. [4] adapted to
array of real numbers. There are many useful the fixed design case. Since then, this estimator
linear statistics based on weighted sums has been studied by many authors. For
n example, Georgiev and Greblicki [5], Georgiev
Sn a ni X i .One example is the simple
i 1 [6], Müller [9] studied for independent errors.
parametric regression model In recent years, there are many authors to study
Yi i i , where {i ;i 1} is a sequence of for dependent random errors. Wang et al. [12]
random errors, { i ;i 1} is a sequence of real investigated complete convergence for the
numbers and is the parameter of interest. estimator under extended negatively dependent
The least squares estimator ˆ of , based on errors, Chen et al. [2] established complete
n convergence and complete moment
a sample of size n, satisfies
convergence for weighted sum of asymptotic
n
ˆ 1 negatively associated random variables and
n n i i .
2 i 1 gave its application in nonparametric regression
i
i 1 model, Shen and Zhang [10] obtained complete
The aim of this paper is to investigate laws consistency and convergence rate for the
n estimator of nonparametric regression model
of large numbers for S a X of pairwise
n ni i based on asymptotically almost negatively
i 1
associated errors. To the best of our knowledge,
independent with heavy tails {Xnn ; 1}, and
study convergence in probability for the convergence of the estimator (1.2) in the model
estimator of nonparametric regression model (1.1) under pairwise independent errors with
based on pairwise independent errors with heavy tails has not been studied.
heavy tails.
3. Preliminaries
2. Brief review
Let {ann ; 1} and {bnn ; 1} be sequences
Consider the following nonparametric of positive real numbers. We use notation
regression model: abnn instead of
Y f( x ) ,1 i n , 0 lim infan / b n l im sup a n/ b n ;
ni ni ni (1.1)
ann o() b means that limabnn / 0 ; notation
where x are known fixed design points from a n
ni abnn~ is used for limabnn / 1. These
n
compact set A ℝm, fx() is an unknown notations are also used for positive real
regression function defined on A , i are functions fx() and gx(). The indicator
random errors. As an estimator of fx( ), the function of A is denoted by IA(). Throughout
following weighted regression estimator will be this paper, the symbol C will denote a generic
considered constant (0 C ) which is not necessarily
n the same one in each appearance.
ˆ
fn()(), x W ni x Y ni
i 1 (1.2) We recall the concept of slowly varying
functions as follows.
T.D. Xuan, N.T.Quyen, N.T.T.An,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 51-57 53
Definition 3.1. Let a 0 . A positive Lemma 3.6 ([7]). Let r 0. Suppose that
measurable function fx() on [;)a is called EX(| |r ) and EY(| |r ) . Then,
slowly varying at infinity if
EXYEXEY(| |r ) 2 r [ (| | r ) (| | r )].
f() tx
1 as tx for all 0. 4. Results
ft()
For x 0 we denote In the first theorem, we establish the
Marcinkiewicz laws of large numbers type for
log (xx ) max{1,ln( )}, where ln(x ) is the
weighted sum of pairwise independent and
natural logarithm function. Clearly,
identically distributed random variables with
log (x )
log (xx ), log (log ( )), and so heavy tails.
log (log (x ))
on are slowly varying functions at infinity. Theorem 4.1. Let 1 r 2, 0 p r , and
let {X , X ; n 1} be a sequence of pairwise
Definition 3.2. Let {Xn ; 1} be a n
n independent and identically distributed random
sequence of random variables. X converges in
n variables with zero mean and
probability to the random variable X if for
P(| X | x ) x r ( x ) , where ()x is a slowly
every 0,
varying function at infinity such that
limPXX (|n | ) 0. 1/p r / p 1
n ()()n o n . Let {ani ;1 i n , n 1} be a
p triangle array of real numbers such that
Notation: XXn as n .
n
2
Lemma 3.3 ([1, 3]). Let 12 r , X be a ani O( n ). (1.3)
random variable. If P(| X | x ) x r ( x ) , i 1
where ()x is a slowly varying function at Then,
1 n
infinity. Then, a X p 0 as n .
n1/ p ni i
(a) E(| X | I (| X | x )) x1 r ( x ) . i 1
Proof. For each n 1 and 1 in, put
(b) E(| X |22 I (| X | x )) x r ( x ) .
Y X I(| X | n1/ p ), Z X I(| X | n1/ p ),
ni i i ni i i
It is easy to prove the following lemma. n n
Sn a ni[ Y ni E ( Y ni )], Sn a ni[ Z ni E ( Z ni )].
Lemma 3.4. Let {Xnn ; 1} be a sequence i 1 i 1
of pairwise independent random variables with
{Yni ;1 i n }
EX( ) 0 and EX()2 . Then, We have that and
n n {Z ;1 i n }
nn ni is also sequences of pairwise
(a) EXEX(|nn |) (| |). independent and identically distributed random
ii 11 n
nn a X S S
22 ni i n n
(b) EXEX(|nn | ) ( ). variables, i 1 .
ii 11
For 0,n 1, we see that
Lemma 3.5 (Markov’s inequality, [7]).
r n nn1/pp 1/
Suppose that EX(| | ) for some r 0, and 1/ p
P | ani X i | n P | S n | P | S n |
let x 0.Then, i 1 22
:. II
EX(| |r ) 12
P(| X | x )r . I ,
x For 1 we have
54 T.D. Xuan, N.T.Quyen, N.T.T.An,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 51-57
n
442 2 2
I1 2 2/pp E | Sn | 2 2/ a ni E [ Y ni E ( Y ni )]
nni 1
nn
442 2 2 2 1/ p
2 2/ppani E( Y ni ) 2 2/ a ni E ( X I (| X | n ))
nnin 11
Cn()1/ p
0 as n .
2nrp / 1
Next, we prove I2 0 as n . We have by the Cauchy-Schwarz inequality and (1.3) that
nn1/2
2
|ani | n a ni Cn .
ii 11
Thus,
22n
I2 1/pp E | Sn | 1/ E | a ni ( Y ni E ( Z ni )) |
nni 1
nn
2 2 2 1/ p
1/ppE(| ani Z ni |) 1/ | a ni | E ( X I (| X | n ))
nnin 11
Cn()1/ p
0 as n .
nrp/1
n
2 1 2/ p
We complete the proof. Wni ( x ) O ( n ), (1.1)
i 1
In next theorem, we establish convergence then for any x c() f ,
ˆ p
in probability of the estimator fxn (), which is ˆ
fn ( x ) f ( x ) as n ,
defined by (1.2), to the regression function
fx() in the model (1.1). For any x A,the where cf() denotes all continuity points of the
following assumptions on weight functions function fx() on A .
Wxni () will be used. Proof. For any x c() f , it is obvious that
n n
fxfxˆˆ() () Wx () [(()) Efx fx ()].
(A1) |Wni ( x ) 1| o (1) ; n ni nj n
i 1 i 1
n 1/ p
Applying Theorem 4.1 with ani n W ni () x ,
(A2) | |Wni ( x ) | O (1) ;
i 1 we have that
n
(A3) p
n Wni( x ) ni 0 as n .
i 1
|Wxfxni ( ) || ( ni ) fxIx ( ) | ( ni xao ) (1)
i 1 Thus, in order to complete the proof, we
for any a 0.
need to show that
Theorem 4.2. Let 12 r , 0 pr. In the ˆ
E( fn ( x ) f ( x )) 0 as n .
model (1.1), assume that ( ,i ;1 in ) is a
sequence of pairwise independent and identically Since x c() f , for any 0, there exists
distributed errors with zero mean and 0 such that |f ( x ) f ( x ) | holds for all
P(| | x ) x r ( x ), x A and xx . If we choose
a (0, ) , then we have
where ()x is a slowly varying function at
infinity such that ()()n1/p o n r / p 1 . If
T.D. Xuan, N.T.Quyen, N.T.T.An,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 51-57 55
n
ˆ
|(()Efxfxn ())| Wxfx ni ()() ni fx ()
i 1
n
|Wni ( x ) || f ( x ni ) f ( x ) | I ( x ni x a )
i 1
nn
|Wxfxni ( ) || ( ni ) fxIxxa ( ) | ( ni ) Wx ni ( ) 1 | fx ( ) |
ii 11
nn
|Wxni ( ) | |Wxfx ni ( ) || ( ni ) fxIxxa ( ) | ( ni )
ii 11
n
Wni (x ) 1 | f ( x ) | 0 as n followed by 0 (by (A1)-(A3)).
i 1
ˆ
Hence, E( fn ( x ) f ( x )) 0 as n .
5. Example and numerical simulation x i/ n
Taking ni for 1 in. For any
Let and be two independent complex ||xx ||xx
1 2 x (0,1) , we write n1 , n2 ,...
random variables, which are uniformly
||xx
distributed on the unit circle nn as
{z a bi :| z | 1}, ()x be the CDF of |x x | | x x | | x x |,
n,(),(),() R12 x n R x n Rn x
the standard normal distribution. For n 1, set
if |x x | | x x | , then ||xx is
1 arg()n 1 ni nj ni
e 1() 12. It follows by Janson considered to be in front of ||xx when
n 22 nj
xxni nj .
[8] that {enn ; 1} is a sequence of pairwise
2/3
independent standard normal random variables. Let r 3/ 2, p 6 / 5 . Let knn [] be the
2/3
Let be a symmetric random variable with the integer part of n , we define
tail probability 1
, if |xni x | | x n,() R x x |
1 Wx() k kn
P(| | x ) for x 0, ni n
r
xxlog ( ) 1 0, otherwise.
where 12 r . Let F be the distribution It is easy to see that all the conditions (A1)-
function of . For n 1, we define (A3) are satisfied and (1.4) holds. From
1
nn 0.1Fe ( ( )). Theorem 4.2, for any x (0,1) , we obtain
We have that { ;n 1} is a sequence of ˆ p
n fn ( x ) f ( x ) as n .
pairwise independent and identically distributed
Let f( x ) 3 x2 if x [0,1] and fx( ) 0
random variables with zero mean and
otherwise. Taking the sample sizes n as 200,
P(| | x ) x r / log ( x ) . Noting that
i 500, 800 and 1600. For each sample size, we
Var() . ˆ
use R software to compute fn ()() x f x for
Consider the nonparametric regression model: 300 times and get the corresponding boxplots
Yni f( x ni ) ni ,1 i n , by taking x 0.1, 0.5, 0.9 and the sample size
where fx() is an unknown continuous function n as 200, 500, 800 and 1600 respectively in
Figures 1, 2, 3; the values of mean and root
on [0,1], (ni ;1 in ) has the same
mean square error (rmse) at , x 0.5
distribution as (12 , ,... n ).
and x 0.9 in Table 1.
56 T.D. Xuan, N.T.Quyen, N.T.T.An,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 51-57
ˆ
Figure 1. Boxplots of fn ()() x f x at x 0.1
ˆ
Figure 2. Boxplots of fn ()() x f x at x 0.5
ˆ
Figure 3. Boxplots of fn ()() x f x at x 0.9
T.D. Xuan, N.T.Quyen, N.T.T.An,... / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 51-57 57
[4] Georgiev A. A. et al., 1985, Local properties of
Table 1. The mean and rmse of fxˆ ()
n function fitting estimates with applications to system
n x fx() mean rmse identification. In: Grossmann W (ed) Mathematical
th
0.1 0.03 0.147 0.207 statistics and applications, volume b, proceedings 4
Pannonian symposium on mathematical statistics, 4–
200 0.5 0.75 0.781 0.113 10, September, 1983, Bad Tatzmannsdorf, Austria.
0.9 2.43 2.190 0.263 Reidel, Dordrecht, 141-151.
0.1 0.03 0.082 0.113 [5] Georgiev A. A., Greblicki W., 1986, Nonparametric
500 0.5 0.75 0.753 0.120 function recovering from noisy observations, J Stat
0.9 2.43 2.350 0.164 Plan Inference, 13(1), 1-14.
0.1 0.03 0.047 0.181 [6] Georgiev A. A., 1988, Consistent nonparametric
multiple regression: the fixed design case, J
800 0.5 0.75 0.749 0.098 Multivar Anal 25(1), 100-110,
0.9 2.43 2.410 0.074 [7] Gut, A., 2013, Probability: A Graduate Course,
0.1 0.03 0.033 0.073 second ed., Springer.
1600 0.5 0.75 0.759 0.065 [8] Janson S., 1988, Some pairwise independent
0.9 2.43 2.440 0.065 sequences for which the central limit theorem fails,
Stochastics, 23, 439-448.
References [9] Müller H.G., 1987, Weak and universal consistency
of moving weighted averages, Period Math Hung,
[1] Hồ Minh Châu, Lê Văn Dũng, Lương Thị Mỹ Hạnh, 18(3), 241-250.
2018, Luật số lớn đối với tổng ngẫu nhiên có trọng [10] Shen A. and Zhang S., 2020, On Complete
số các biến ngẫu nhiên độc lập đôi một có mô men consistency for the estimator of nonparametric
cấp r vô hạn, Tạp chí Khoa học Trường Đại học Sư regression model based on asymptotically almost
phạm - ĐH Đà Nẵng, 30(04), 66-72. negatively associated errors, Methodology and
[2] Chen Zh., Lu C., Shen Y., Wang R. and Wang X., Computing in Applied Probability. DOI:
2019, On complete and complete moment 10.1007/s11009-020-09813-x
convergence for weighted sums of ANA random [11] Stone C.J., 1977, Consistent nonparametric
variables and applications, Journal of Statistical regression, Ann Stat 5, 595-645.
Computation and Simulation. DOI: [12] Wang X.J., Zheng L.L., Hu Sh., 2015, Complete
10.1080/00949655.2019.1643346 consistency for the estimator of nonparametric
[3] Dung L.V., Son T.C. and Hai Yen N.T., 2018, Weak regression models based on extended negatively
laws of large numbers for sequences of random dependent errors, Stat: J Theor Appl Stat., 49(2),
variables with infinite rth moments, Acta 396-407.
Mathematica Hungarica, 156, 408-423. File đính kèm:
hoi_tu_theo_xac_suat_doi_voi_uoc_luong_mo_hinh_hoi_quy_phi_t.pdf

