Không tìm thấy kết quả nào
Chúng tôi không thể tìm thấy bất cứ điều gì với thuật ngữ đó vào lúc này, hãy thử tìm kiếm cái gì đó khác.
Máy tính độ lệch chuẩn trực tuyến giúp bạn tính nhanh giá trị trung bình, phương sai và độ lệch chuẩn của mẫu hoặc tổng thể kèm theo các bước giải chi tiết.
| Mẫu | Dân số | |
|---|---|---|
| Độ Lệch Chuẩn | σ = 5.3385 | s = 4.9937 |
| Phương Sai | σ2 = 28.5 | s2 = 24.9375 |
| Số Lượng | n = 8 | n = 8 |
| Trung Bình | μ = 18.25 | x̄ = 18.25 |
| Tổng Bình Phương | SS = 199.5 | SS = 199.5 |
Có lỗi với phép tính của bạn.
Công cụ máy tính độ lệch chuẩn trực tuyến giúp bạn dễ dàng tính toán độ lệch chuẩn của một tập hợp dữ liệu bất kỳ. Không chỉ vậy, công cụ này còn cung cấp các thông số thống kê quan trọng khác, bao gồm giá trị trung bình và phương sai. Máy tính cũng hỗ trợ xác định khoảng tin cậy của tập dữ liệu ở nhiều mức độ tin cậy khác nhau, đồng thời cung cấp bảng phân phối tần số trực quan.
Để sử dụng công cụ máy tính này, bạn chỉ cần nhập các số liệu đã cho vào ô dữ liệu, phân tách mỗi số bằng một dấu phẩy. Sau đó, chọn xem các số đó đại diện cho một tổng thể (Population) hay một mẫu (Sample), và nhấn "Tính toán" (Calculate) để nhận kết quả ngay lập tức.
Độ lệch chuẩn là một đại lượng thống kê cốt lõi, dùng để đo lường mức độ phân tán hoặc biến thiên của một tập dữ liệu cho trước. Nó cho biết khoảng cách trung bình tổng hợp của các điểm dữ liệu so với giá trị trung bình của toàn bộ tập dữ liệu. Độ lệch chuẩn càng nhỏ, các điểm dữ liệu càng tập trung sát với giá trị trung bình (ít biến động). Ngược lại, độ lệch chuẩn càng lớn, các điểm dữ liệu càng phân tán xa khỏi giá trị trung bình (biến động cao). Trong toán học, độ lệch chuẩn chính là căn bậc hai của phương sai.
Đại lượng này được tính toán dựa trên tính chất của tập dữ liệu gốc. Nếu tập dữ liệu bao gồm toàn bộ các điểm dữ liệu cần nghiên cứu, nó được gọi là độ lệch chuẩn của tổng thể. Tuy nhiên, nếu tập dữ liệu chỉ là một phần được trích xuất từ tổng thể lớn hơn, nó được gọi là độ lệch chuẩn của mẫu.
Độ lệch chuẩn của tổng thể được tính toán khi tập dữ liệu của bạn đại diện cho một tổng thể hoàn chỉnh. Điều này có nghĩa là tập dữ liệu bao gồm tất cả các quan sát đang được xem xét. Đại lượng này thường được ký hiệu bằng chữ σ.
σ là chữ cái viết thường của ký tự Hy Lạp Sigma. Độ lệch chuẩn của tổng thể được xác định bằng công thức sau:
$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$
Trong đó:
Ví dụ thực tế dưới đây sẽ minh họa chi tiết cách tính độ lệch chuẩn cho dữ liệu tổng thể.
Các nhà đầu tư thường coi cổ phiếu là một loại tài sản có rủi ro cao do độ biến động giá trị lớn hơn so với các kênh đầu tư khác. Giả sử, một nhà quản lý quỹ muốn phân tích sự biến động của một mã cổ phiếu trong tháng vừa qua. Nguyên tắc của ông là sẽ không khuyến nghị cho khách hàng bất kỳ cổ phiếu nào có độ lệch chuẩn lớn hơn hoặc bằng giá trị trung bình của chính nó, vì mức độ đó được đánh giá là "quá rủi ro".
Dưới đây là thống kê toàn bộ giá đóng cửa hàng ngày (tính theo USD) của cổ phiếu đó trong tháng trước. Hãy tính độ lệch chuẩn và xác định xem nhà quản lý có đánh giá cổ phiếu này là "quá rủi ro" hay không:
1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81
Lưu ý rằng nhà quản lý chỉ quan tâm đến lịch sử giá cổ phiếu của tháng trước, và danh sách trên đã bao gồm tất cả các mức giá của tháng đó. Do vậy, chúng ta đang có một dữ liệu tổng thể hoàn chỉnh. Vì thế, chúng ta sẽ áp dụng công thức tính độ lệch chuẩn của tổng thể.
Để tìm độ lệch chuẩn, bước đầu tiên là tính giá trị trung bình. Nhắc lại, giá trị trung bình μ được tính bằng cách lấy tổng tất cả các số liệu chia cho tổng số lượng các số đó.
$$\mu=\frac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20 }=1,097$$
Tiếp theo, lấy từng số liệu trừ đi giá trị trung bình, sau đó bình phương các độ lệch này. Cộng tất cả các kết quả lại và chia cho số lượng phần tử. Kết quả thu được chính là phương sai σ².
$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40 -1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$
Cuối cùng, lấy căn bậc hai của phương sai, ta sẽ được độ lệch chuẩn.
$$\sigma=\sqrt{0,045031}\approx0,21$$
Như bạn có thể thấy, độ lệch chuẩn về mức giá của cổ phiếu này trong tháng trước (0,21) nhỏ hơn nhiều so với giá trị trung bình của nó (1,097). Do đó, nhà quản lý quỹ sẽ không coi cổ phiếu này là "quá rủi ro".
Độ lệch chuẩn của mẫu được sử dụng khi tập dữ liệu chỉ là một tập hợp con (một mẫu) đại diện cho một tổng thể lớn hơn. Tập dữ liệu này chứa một số lượng phần tử ít hơn so với toàn bộ các phần tử có thể được xem xét. Độ lệch chuẩn của mẫu thường được ký hiệu là s và được tính theo công thức sau:
$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$
Trong đó:
Chúng ta sẽ sử dụng lại ví dụ về nhà quản lý đầu tư để minh họa cách tính độ lệch chuẩn của dữ liệu mẫu. Giả sử trong tình huống này, nhà quản lý không thể truy cập vào toàn bộ giá đóng cửa của tất cả các ngày giao dịch trong tháng trước. Thay vào đó, ông chỉ có dữ liệu giá đóng cửa của một vài ngày ngẫu nhiên. Lúc này, ông sẽ phải ước lượng độ lệch chuẩn của giá cổ phiếu bằng cách sử dụng dữ liệu từ tập mẫu hiện có.
Giả sử ông có được dữ liệu giá đóng cửa của 5 ngày như sau:
1,31, 1,40, 0,86, 0,88, 1,40
Dù mục tiêu của nhà quản lý vẫn là đánh giá biến động giá cổ phiếu trong toàn bộ tháng trước, nhưng vì ông không có đủ toàn bộ dữ liệu mà chỉ có 5 mức giá đóng cửa, chúng ta đang làm việc với một tập dữ liệu mẫu. Do đó, chúng ta phải sử dụng công thức tính độ lệch chuẩn của mẫu.
Đầu tiên, tính giá trị trung bình của mẫu.
$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$
Tiếp theo, tính phương sai s². Chú ý ở bước này mẫu số sẽ là n-1.
$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88- 1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$
Cuối cùng, lấy căn bậc hai của phương sai để tìm ra độ lệch chuẩn.
$$s=\sqrt{0,0764}\approx 0,28$$
Một trong những ứng dụng quan trọng nhất của độ lệch chuẩn là tính toán phạm vi các giá trị "có thể chấp nhận được". Kỹ thuật này đóng vai trò cốt lõi trong việc đảm bảo chất lượng thống kê công nghiệp và phân tích dự đoán dữ liệu. Nếu dữ liệu cơ sở tuân theo quy luật phân phối chuẩn, phạm vi này được gọi là khoảng tin cậy (sẽ được trình bày chi tiết ở phần tiếp theo). Các khoảng tin cậy thường được biểu diễn ở nhiều mức độ tin cậy (tính theo phần trăm) khác nhau.
Biên độ sai số (Margin of Error) là một thành phần thiết yếu tạo nên độ rộng của khoảng tin cậy. Hiểu một cách đơn giản, biên độ sai số cho biết khoảng chênh lệch tối đa và tối thiểu có thể chấp nhận được của đại lượng đang nghiên cứu.
Biên độ sai số (hay lề lỗi) được tính bằng công thức:
$$Lề\ lỗi\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$
Chúng ta áp dụng công thức này nếu đã biết độ lệch chuẩn của tổng thể, σ. Đồng thời, kích thước mẫu phải đủ lớn (thông thường n>30).
Trong trường hợp chưa biết độ lệch chuẩn của tổng thể và kích thước mẫu nhỏ (thường là n≤30), chúng ta sẽ sử dụng công thức sau:
$$Sai\ số\ biên\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
Ở công thức này, chúng ta sử dụng độ lệch chuẩn của mẫu s để thay thế vì độ lệch chuẩn tổng thể σ chưa được biết.
Các giá trị \$z_{\alpha/2}\$ và \$t_{n-1, \alpha/2}\$ được xác định thông qua thống kê z và thống kê t, thường được gọi là các giá trị tới hạn. Chúng là những hằng số gắn liền với từng mức độ tin cậy cụ thể.
Trong thống kê, các mức khoảng tin cậy được sử dụng phổ biến nhất là 90%, 95% và 99%. Tương ứng với đó, giá trị \$z_{\alpha/2}\$ sẽ là 1,645 (đối với 90%), 1,96 (đối với 95%) và 2,575 (đối với 99%).
Thành phần \$\frac{\sigma}{\sqrt n}\$ hoặc \$\frac{s}{\sqrt n}\$ được gọi là sai số chuẩn (Standard Error).
Như đã đề cập ở trên, khoảng tin cậy là một phạm vi giá trị mà một đại lượng thống kê được kỳ vọng sẽ rơi vào, tương ứng với một mức độ tin cậy (xác suất) nhất định.
Ví dụ: Dựa trên dữ liệu, chúng ta có thể kết luận rằng chiều cao của các bé gái 13 tuổi nằm trong khoảng từ 59 inch đến 66 inch với mức độ tin cậy là 90%. Điều này có nghĩa là, nếu chúng ta chọn ngẫu nhiên một nhóm các bé gái 13 tuổi, có khoảng 90% khả năng chiều cao của các em sẽ nằm trong khoảng giá trị đã dự báo.
Khoảng tin cậy được tính theo công thức:
$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$
Một công thức khác được sử dụng trong trường hợp chúng ta không biết độ lệch chuẩn của tổng thể σ và buộc phải thay thế bằng độ lệch chuẩn của mẫu s:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
Dựa vào các phần trước, chúng ta có thể dễ dàng nhận ra rằng \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ và \$t_{n-1,\alpha/ 2}\left(\frac{s}{\sqrt{n}}\right)\$ chính là các biên độ sai số.
Giả sử chúng ta biết rằng mức giá cổ phiếu hàng ngày đang xem xét tuân theo quy luật phân phối chuẩn. Chúng ta có một mẫu giá cổ phiếu như sau:
1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80
Yêu cầu đặt ra là cần tính toán xem mức giá cổ phiếu sẽ dao động trong phạm vi nào với độ tin cậy 95%.
Vì đây là một tập mẫu nhỏ và chúng ta không biết độ lệch chuẩn của tổng thể, chúng ta sẽ sử dụng độ lệch chuẩn của mẫu cùng với công thức tính khoảng tin cậy tương ứng:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
Đưa các thông số này vào công thức:
$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$
Chúng ta sẽ có các phép tính:
$$1,10 - 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 - 2,26 (\frac{0,23}{3,16}) = 1,10 - 2,26 × 0,07 = 1,10 - 0,16 = 0,94$$
$$1,10 + 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 + 2,26 (\frac{0,23}{3.16}) = 1,10 + 2,26 × 0,07 = 1,10 + 0,16 = 1,26$$
Kết quả này có nghĩa là chúng ta có thể chắc chắn 95% rằng giá cổ phiếu trung bình sẽ nằm trong khoảng tin cậy (0,94, 1,26).