搜索
您的当前位置:首页正文

应用统计学习题与答案

来源:六九路网
--

应用统计学习题及答案

简答题

1.简述普查和抽样调查的特点。 答:

普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点:

(1)普查通常具有周期性。

(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。 (3)普查的数据一般比较准确,规划程度也较高。 (4)普查的使用范围比较窄。

抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。它具有以下几个特点: (1)经济性。这是抽样调查最显著的一个特点。 (2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。

(3)适应面广。它适用于对各个领域、各种问题的调查。 (4)准确性高。

2.为什么要计算离散系数? 答:

离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。

对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据

--

--

的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。

3、加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。 答:

加权算术平均数受各组平均数喝次数结构(权数)两因素的影响。若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数 ;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。

4.解释相关关系的含义,说明相关关系的特点。 答:

变量之间存在的不确定的数量关系为相关关系。

相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。 5.解释抽样推断的含义。 答:

简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。

--

--

6.回归分析与相关分析的区别是什么? 答:

(1)相关分析所研究的两个变量是对等关系,而回归分析所研究的两个变量不是对等关系;(2)对于两个变量X和Y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,而回归分析可分别建立两个不同的回归方程;(3)相关分析对资料的要求是,两个变量都必须是随机的,而回归分析对资料的要求是自变量是给定的,因变量是随机的。

7.什么是方差分析? 答:

方差分析是通过对误差的分析,检验多个总体均值是否相等的一种统计方法。它分为单因素方差分析和双因素方差分析。

8.简述相关分析与回归分析的联系。 答:

相关分析是用于判断两个变量之间相关关系的密切程度,进而对这种判断的可靠程度加以检验的统计方法;而回归分析是分析研究变量之间相关关系的一种统计分析方法,考察一个变量随其余变量变化而变化的情况。相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。 计算题

1.下面是20个长途电话通话时间的频数分布,计算该数据的平均数

通话时间/频数 分钟 4-7 4 通话时间/频数 分钟 20-23 --

1 --

8-11 12-15 16-19 答案: 由题意:

通话时间/分钟 4-7 8-11 12-15 16-19

65 7 2 24-27 合计 1 20 xi fi 通话时间/分钟 20-23 24-27 合计 xi fi 5.4 5 9.5 5 137 .5 172 .5 211 .5 251 .5 20 平均数=i16xfii=12.3

fi2.拥有工商管理学位的大学毕业生每年年薪的标准差大约i1为2000美元,假定希望估计每年年薪底薪的95%置信区间,当边际误差分别500美元时,样本容量应该为多大?(21.96)

答:

 n/2 n22/22=61.47=62

3.某一汽车装配操作线完成时间的计划均值为2.2分钟。由于完成时间既受上一道装配操作线的影响,又影响到下一道

--

--

装配操作线的生产,所以保持2.2分钟的标准是很重要的。一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。答案:

根据题意,此题为双侧假设检验问题 (1)原假设H0:=2.2;备择假设H1:2.2 (2)构造统计量:U(3)由于0.05,则查表得:U/2xs/n1.962

,得U=2.39-2.26.373

0.2/45U0.0251.96

(4)6.3731.96,U>U/2,所以拒绝原假设,即在0.05的显著水平下没有达到2.2分钟的标准。

4.下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。

总评分 2.6 3.4 3.6 解: Xi Yi Xi2 月薪/美元 总评分 2800 3100 3500 3.2 3.5 2.9 月薪/美元 3000 3400 3100 XiYi Yi2 2.6 3.4 2800 3100 6.76 11.56 --

7280 10540 7840000 9610000 --

3.6 3.2 3.5 2.9 3500 3000 3400 3100 12.96 10.24 12.25 8.41 12600 9600 11900 8990 12250000 9000000 11560000 9610000 59870000 X=i619.2

6i1Y=i618900 6i1X=2i662.18 i1XY=ii660910 i16(Xi)(Yi)bX设Yb 19.21890001i1i1XY60910in6==581.08 b1i1619.219.2262.18(X)i6X=18900/6-581.08*19.2/6=1290.54 b0Yb612i1Xi11290.54n581.08X 于是Yi5.设总体 (lnx)2X的概率密度函数为

12e,x0f(x,)2x

,xX,0X,...,X是来自0其中为未知参数,12nX的样本。

ˆ(); (1)试求g()31的极大似然估计量gˆ() 是g()的无偏估计量。 (2)试验证g解:

(1)当xi>0时,似然函数为:

(lnx)12 Lx1,x2,...,xn;e2xn;ilnLx1,x2,...,xn0,即 lnxn0 令

i2ni11ˆlnxi 解得:ni1g()31是的单调函数,所以

3nˆlnxi1 g()的极大似然估计量g2(lnxn)i1lnx(lnx)22lnxE(lnX)(2)因为edx2ed(lnx)2x00 2it3(t)ˆE(g())eEd(lnXi)13E(lnX)131g(), 2ni1ˆ()是g()的无偏估计量。 故g(t)2n2

6、某商店为解决居民对某种商品的需要,调查了100户住

--

--

户,得出每月每户平均需要量为10千克,样本方差为9。若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要? 解:

设每月每户至少准备x0 P(xx0)95%  P(x 当n30时,s

/nx0)95%

/nx0x01095% 310/100s/nx01.645  x010.44kg 查表得,3/10若供应10000户,则需要准备104400kg。

7.糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求:

(1)平均每包重量的置信区间,若总体标准差为5克; (2)平均每包重量的置信区间,若总体标准差未知; (t0.025,92.2622,t0.025,102.2281,t0.05,91.8331,t0.05,101.8125); 解:

n=10,为小样本 (1) 方差已知,由x±

xXi1nt2,n1in,

/10,

5tt0.025,9 ,n1n102s计算可得平均每包重量的置信区间为(494.9,501.1) t(2)方差未知,由x±

xn=(494+495+503+506+492+493+498+507+502+490)

Xi1n2,n1in

1nS(xix)2n1i1s即样本方差,

/10, t2n=(494+495+503+506+492+493+498+507+502+490)

,n1sst0.025,9 n10--

--

计算可得,平均每包重量的置信区间为(493.63,502.37)

8.假定某化工原料在处理前和处理后取样得到的含脂率如下表:

处理0.140 0.138 0.143 0.142 0.144 0.137 前 处理0.135 0.140 0.142 0.136 0.138 0.140 后 假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。 解:

根据题中数据 可得:

x10.141,x20.139,S10.0028,S20.0027,n1n26

由于 n1n26<30,且 总体方差未知,所以先用F检验两总体方差是否存在差异。 (1) 设H0:1222;H1:1222

S12则 F=21.108

S2由n1n26,查

F分布得F0.025(5,5)7.15,F0.975(5,5)0.14

FF(5,5)

2 接受H0,即处理前后两总体方差相同。

(2) 设H0:12,H1:12

则T=

x1x2S011T=1.26接受H0,即处理前后含脂率无显著差异。

9.根据下表中Y与X两个变量的样本数据,建立Y与X的一元线性回归方程。

--

--

Y X 120 140 fx 解:

设x为自变量,y为因变量,一元线性回归 设回归方程为y=b0b1x 1165022x(x)iib0yb1x127n.14291.53815150.213

回归方程为

fij 5 10 0 4 4 15 8 3 11 20 10 0 10 fy 0 3 3 18 10 28 b1=

xyiixniyi=10001.538

y=150.213-1.538x

10.以下为16种零食的卡路里含量:110 120 120 164 430 192 175 236 429 318 249 281 160 147 210 120。试计算均值和中位数。 解:

现把16个变量值由小到大排序如下:

110 120 120 120 147 160 164 175 192 210 236 249 281 318 429 430

(1)中位数的位次为(n+1)/2=8.9,所以中位数计算如下:

Me16(2)均值计算如下: x175192183.50 23461216.32 16xi1i

n--

--

11.某企业2005年第三季度各月末的职工人数资料见下表:

时间(月末)

又知2005年6底的职工人数为2030人,试计算第三季度的平均职工人数。 解:

依题意,计算如下: 2030Y22090206041213126230.52076.83(人)

37 8 2060 9 2131 职工人数(人) 2090

12.某集团公司对生产的一批A产品进行抽样调查,随机抽取的200件中有170件合格。试以95%的概率估计该批产品合格率的置信区间。 解:

已知p17085%0.85,n200,np1705,n(1p)305,当

0.05时,查表Z/21.96,于是有:

p(1p),pZ/2p(1p)) nn0.85(10.85)=(0.851.96,0.851.960.85(10.85))

200200=(0.8005,0.8995),即这批产品合格率的置信区间为

200(pZ/280.05%~89.95%。

13.某电子产品的质量标准是平均使用寿命不得低于1000小时。已知该电子产品的使用寿命服从标准差为100小时的正态分布。一商场打算从该厂进货,随机抽取81件进行检验,测得其平均寿命为990小时,问商场是否决定购进这批电子产品?(已知Z0.05解:

依题意,设H0:1000,H1:1000,这是左侧检验,检验统

--

1.645)

--

计量Z为:

Zx0假设,即可以认为这批电子元件达到了质量标准,商场可以决定购进这批电子产品。

/n9901000100/810.9,由于Z0.9Z0.051.645,故接受原

--

因篇幅问题不能全部显示,请点此查看更多更全内容

Top