Máy tính độ lệch chuẩn

Với một tập dữ liệu rời rạc cho trước, công cụ máy tính này sẽ tính toán giá trị trung bình, phương sai và độ lệch chuẩn của một mẫu hoặc một tổng thể và hiển thị tất cả các bước thực hiện của các phép tính.

Bộ Dữ Liệu

Các số được phân tách bằng dấu phẩy

Máy tính Liên quan

	Mẫu	Dân số
Độ Lệch Chuẩn	σ = 5.3385	s = 4.9937
Phương Sai	σ2 = 28.5	s2 = 24.9375
Số Lượng	n = 8	n = 8
Trung Bình	μ = 18.25	x̄ = 18.25
Tổng Bình Phương	SS = 199.5	SS = 199.5

Có lỗi với phép tính của bạn.

Mục lục

Độ lệch chuẩn
Độ lệch chuẩn của Tổng thể
1. Ví dụ về cách tính độ lệch chuẩn của tổng thể tổng quát
Độ lệch chuẩn của Mẫu
Biên độ sai số
Khoảng tin cậy
1. Ví dụ về tính khoảng tin cậy

Máy tính độ lệch chuẩn

Máy tính độ lệch chuẩn giúp tính toán độ lệch chuẩn của một tập hợp các số. Ngoài ra, nó cung cấp các thông tin bổ sung về tập hợp số đó, bao gồm giá trị trung bình và phương sai. Công cụ máy tính này cũng tính toán khoảng tin cậy của tập dữ liệu cho các mức tin cậy khác nhau và cung cấp bảng phân phối tần số.

Để sử dụng công cụ máy tính này, bạn hãy nhập các số đã cho vào máy tính, phân tách các số bằng dấu phẩy. Chọn liệu các số đó đại diện cho một tổng thể hay một mẫu, và nhấn "Tính toán" (Calculate).

Độ lệch chuẩn

Độ lệch chuẩn là một phép đo thống kê xác định mức độ phân tán hoặc biến thiên của một tập hợp dữ liệu cho trước. Nó cung cấp khoảng cách trung bình tổng hợp của các điểm dữ liệu so với giá trị trung bình của tập dữ liệu. Độ lệch chuẩn càng nhỏ, các điểm dữ liệu càng gần với giá trị trung bình. Ngược lại, độ lệch chuẩn càng cao, các điểm dữ liệu càng xa giá trị trung bình. Độ lệch chuẩn là căn bậc hai của một phép đo phân tán khác gọi là phương sai.

Độ lệch chuẩn được tính toán dựa trên thông tin về tập dữ liệu. Nếu tập dữ liệu đại diện cho tất cả các điểm dữ liệu (tổng thể), thì độ lệch chuẩn được gọi là độ lệch chuẩn của tổng thể. Tuy nhiên, nếu tập dữ liệu đại diện cho một mẫu từ một tổng thể, thì độ lệch chuẩn đó được gọi là độ lệch chuẩn của mẫu.

Độ lệch chuẩn của Tổng thể

Độ lệch chuẩn của tổng thể được tính toán khi tập dữ liệu đại diện cho một tổng thể. Đó là, tập dữ liệu đại diện cho tất cả các quan sát được xem xét. Độ lệch chuẩn của tổng thể được ký hiệu bằng σ.

σ là chữ thường của một chữ cái Hy Lạp được gọi là Sigma. Độ lệch chuẩn của tổng thể được tính bằng công thức sau:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Trong đó:

Σ là chữ cái Hy Lạp viết hoa của Sigma, được sử dụng để biểu diễn tổng trong toán học;
xᵢ biểu thị mỗi điểm dữ liệu (mỗi quan sát của tập dữ liệu), bắt đầu từ điểm dữ liệu đầu tiên đến điểm dữ liệu thứ N (cuối cùng);
μ biểu thị giá trị trung bình của tổng thể;
n là kích thước của tổng thể.

Ví dụ về cách tính độ lệch chuẩn của tổng thể tổng quát

Ví dụ sau minh họa cách tính độ lệch chuẩn của dữ liệu tổng thể.

Nhà đầu tư coi cổ phiếu là một tài sản rủi ro cao do độ biến động cao so với các loại tài sản khác. Một nhà quản lý đầu tư muốn phân tích sự biến động của một số cổ phiếu trong tháng trước và sẽ không khuyến nghị cho khách hàng của mình bất kỳ cổ phiếu nào có độ lệch chuẩn lớn hơn hoặc bằng với giá trị trung bình của nó vì nhà đầu tư ấy coi loại cổ phiếu đó là "quá rủi ro".

Dưới đây là tất cả các giá đóng cửa hàng ngày (theo USD) của các cổ phiếu trong tháng trước. Tính độ lệch chuẩn và xác định xem liệu nhà quản lý có coi cổ phiếu này là "quá rủi ro" hay không:

1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81

Lưu ý rằng nhà quản lý chỉ quan tâm đến giá cổ phiếu của tháng trước, và các mức giá đã liệt kê ở trên là tất cả các mức giá của tháng trước. Do đó, chúng ta có một tổng thể để sử dụng. Vì vậy, chúng ta sẽ tính toán độ lệch chuẩn bằng cách sử dụng công thức cho độ lệch chuẩn của tổng thể.

Để tìm độ lệch chuẩn, trước tiên hãy tính giá trị trung bình. Hãy nhớ rằng giá trị trung bình μ được tính bằng cách chia tổng giá trị của các số cho số lượng các số.

$$\mu=\frac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20 }=1,097$$

Tiếp theo, trừ giá trị trung bình cho mỗi số và bình phương các chênh lệch này. Sau đó, cộng các kết quả và chia kết quả thu được cho số lượng. Kết quả được gọi là phương sai σ².

$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40 -1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$

Cuối cùng, lấy căn bậc hai của phương sai để có độ lệch chuẩn.

$$\sigma=\sqrt{0,045031}\approx0,21$$

Như bạn có thể thấy, độ lệch chuẩn các mức giá của cổ phiếu này trong tháng trước nhỏ hơn so với giá trị trung bình. Do đó, nhà quản lý sẽ không xem xét cổ phiếu này là "quá rủi ro."

Độ lệch chuẩn của Mẫu

Độ lệch chuẩn của mẫu được tính khi tập dữ liệu được xem xét đại diện cho một mẫu từ một tổng thể. Tập dữ liệu đại diện cho một tập hợp nhỏ hơn của các phần tử từ tất cả các phần tử đang xem xét. Độ lệch chuẩn của mẫu được ký hiệu là s. Độ lệch chuẩn của mẫu được tính theo công thức sau:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Trong đó:

Σ biểu thị tổng;
xᵢ biểu diễn mỗi điểm dữ liệu;
x̄ biểu diễn giá trị trung bình của mẫu;
n là kích thước của mẫu.

Chúng ta sẽ minh họa cách tính độ lệch chuẩn của dữ liệu mẫu bằng cách sử dụng cùng một ví dụ như đối với độ lệch chuẩn của tổng thể. Nhưng trong tình huống này, nhà quản lý đầu tư không có quyền truy cập vào giá đóng cửa của tất cả các ngày giao dịch của tháng trước. Tuy nhiên, anh ấy có dữ liệu giá đóng cửa của một số ngày ngẫu nhiên trong tháng trước. Do đó, anh ấy sẽ ước tính độ lệch chuẩn của giá cổ phiếu đóng cửa bằng cách sử dụng dữ liệu từ mẫu có sẵn.

Giả sử rằng anh ấy có dữ liệu các giá đóng cửa trong 5 ngày:

1,31, 1,40, 0,86, 0,88, 1,40

Lưu ý rằng nhà quản lý quan tâm đến các mức giá của giá cổ phiếu trong tháng trước. Tuy nhiên, anh ấy không có tất cả các mức giá của tháng trước, mà chỉ có một tập hợp nhỏ các giá đóng cửa của chỉ 5 ngày. Vì vậy trong trường hợp này chúng ta đang làm việc với một mẫu. Chúng ta sẽ tính toán độ lệch chuẩn bằng cách sử dụng công thức độ lệch chuẩn của mẫu.

Trước tiên, tính giá trị trung bình của mẫu.

$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$

Tiếp theo, tính phương sai s².

$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88- 1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$

Cuối cùng, lấy căn bậc hai của phương sai để có độ lệch chuẩn.

$$s=\sqrt{0,0764}\approx 0,28$$

Biên độ sai số

Một trong những ứng dụng của độ lệch chuẩn là tính toán phạm vi giá trị "có thể chấp nhận được". Điều này đóng một vai trò quan trọng trong việc đảm bảo chất lượng thống kê của ngành và phân tích dự đoán. Giả sử dữ liệu cơ bản đang được xem xét tuân theo phân phối chuẩn. Trong trường hợp đó, phạm vi này được gọi là khoảng tin cậy (tham khảo phần tiếp theo). Các khoảng tin cậy này được đưa ra ở nhiều mức độ tin cậy (hoặc phần trăm) khác nhau.

Biên độ sai số là một thành phần của khoảng tin cậy tạo nên độ rộng của khoảng tin cậy. Nghĩa là, sai số cho biết giá trị tối đa và tối thiểu được chấp nhận của đại lượng đang được xem xét.

Biên độ sai số được tính bằng công thức:

$$Lề\ lỗi\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Chúng ta áp dụng công thức này nếu biết độ lệch chuẩn của tổng thể, σ. Đồng thời mẫu phải đủ lớn (thường là n>30).

Khi chưa biết độ lệch chuẩn của tổng thể và mẫu nhỏ (thường là n≤30), chúng ta sử dụng công thức sau:

$$Sai\ số\ biên\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Trong công thức này, chúng ta sử dụng độ lệch chuẩn mẫu s vì độ lệch chuẩn tổng thể σ chưa được biết.

\$z_{\alpha/2}\$ và \$t_{n-1, \alpha/2}\$ được xác định lần lượt bằng cách sử dụng thống kê z và thống kê t và được gọi là giá trị tới hạn. Chúng là các hằng số gắn liền với mức độ tin cậy.

Khoảng tin cậy phổ biến nhất được sử dụng trong thống kê là 90%, 95% và 99%. Và giá trị \$z_{\alpha/2}\$ của chúng là 1,645 (đối với 90%), 1,96 (đối với 95%) và 2,575 (đối với 99%)

\$\frac{\sigma}{\sqrt n}\$ hoặc \$\frac{s}{\sqrt n}\$ được gọi là sai số chuẩn.

\$\frac{\sigma}{\sqrt n}\$ được sử dụng khi chúng ta biết độ lệch chuẩn của tổng thể σ và chúng ta có một mẫu lớn (thường là n>30).
\$\frac{s}{\sqrt n}\$ được sử dụng cho trường hợp chúng ta không biết độ lệch chuẩn của tổng thể và chúng ta có một mẫu nhỏ (thường là n≤30). Nghĩa là, thay vì độ lệch chuẩn của tổng thể chung σ, chúng ta phải sử dụng độ lệch chuẩn của mẫu mà chúng ta có sẵn s.

Khoảng tin cậy

Như đã giới thiệu ở trên, khoảng tin cậy là một khoảng (phạm vi giá trị) trong đó một đại lượng nhất định được kỳ vọng sẽ nằm ở một mức độ tin cậy nhất định.

Ví dụ: chúng ta có thể nói rằng một con số nhất định, chẳng hạn như chiều cao của các bé gái 13 tuổi, nằm trong khoảng từ 59 inch đến 66 inch với mức độ tin cậy 90%. Nghĩa là, nếu chúng ta chọn một nhóm các bé gái 13 tuổi, khoảng 90% trường hợp chiều cao của các em sẽ nằm trong khoảng giá trị cho trước.

Khoảng tin cậy được tính bằng công thức:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

x̄ là giá trị trung bình của mẫu,
\$z_{\alpha/2}\$ là giá trị tới hạn,
σ là độ lệch chuẩn của tổng thể,
n là số lượng phần tử.

Một công thức khác được sử dụng khi chúng ta không biết độ lệch chuẩn của tổng thể σ và thay vào đó chúng ta phải sử dụng độ lệch chuẩn mẫu s:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

x̄ là giá trị trung bình của mẫu,
\$t_{n-1,\alpha/2}\$ là giá trị tới hạn,
s là độ lệch chuẩn mẫu,
n là số lượng phần tử.

Như chúng ta có thể biết từ phần trước \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ và \$t_{n-1,\alpha/ 2}\left(\frac{s}{\sqrt{n}}\right)\$ là biên độ sai số.

Ví dụ về tính khoảng tin cậy

Giả sử chúng ta biết rằng giá cổ phiếu hàng ngày mà chúng ta đang xem xét có phân phối chuẩn. Chúng ta có một mẫu giá cổ phiếu:

1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80

Chúng ta cần tính toán xem giá cổ phiếu sẽ dao động trong phạm vi nào với độ tin cậy 95%.

Đây là mẫu nhỏ và chúng ta không biết độ lệch chuẩn của tổng thể nên sẽ sử dụng độ lệch chuẩn mẫu và công thức tương ứng để tính:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

x̄ là giá trị trung bình mẫu, 1,10
\$t_{n-1,\alpha/2}$ là giá trị tới hạn, \$t_{9, 0,025}\$ = 2,26 (giá trị tới hạn cho một cỡ mẫu và mức độ tin cậy nhất định thường được tính từ bảng z hoặc bảng t)
s là độ lệch chuẩn mẫu, 0,23
n là số lượng phần tử, 10,
\$\frac{s}{\sqrt n}\$ là sai số tiêu chuẩn \$\frac{0,23}{\sqrt{10}}=0,07\$

Vì vậy chúng ta đưa các số vào công thức

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

và chúng ta có:

$$1,10 - 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 - 2,26 (\frac{0,23}{3,16}) = 1,10 - 2,26 × 0,07 = 1,10 - 0,16 = 0,94$$

$$1,10 + 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 + 2,26 (\frac{0,23}{3.16}) = 1,10 + 2,26 × 0,07 = 1,10 + 0,16 = 1,26$$

Điều này có nghĩa là chúng ta chắc chắn 95% rằng giá cổ phiếu trung bình nằm trong khoảng tin cậy (0,94, 1,26).

Máy tính Liên quan