Máy Tính Thống Kê
Máy tính độ lệch chuẩn


Máy tính độ lệch chuẩn

Máy tính độ lệch chuẩn trực tuyến giúp bạn tính nhanh giá trị trung bình, phương sai và độ lệch chuẩn của mẫu hoặc tổng thể kèm theo các bước giải chi tiết.

Mẫu Dân số
Độ Lệch Chuẩn σ = 5.3385 s = 4.9937
Phương Sai σ2 = 28.5 s2 = 24.9375
Số Lượng n = 8 n = 8
Trung Bình μ = 18.25 x̄ = 18.25
Tổng Bình Phương SS = 199.5 SS = 199.5

Có lỗi với phép tính của bạn.

Mục lục

  1. Độ lệch chuẩn
  2. Độ lệch chuẩn của Tổng thể
    1. Ví dụ về cách tính độ lệch chuẩn của tổng thể
  3. Độ lệch chuẩn của Mẫu
  4. Biên độ sai số
  5. Khoảng tin cậy
    1. Ví dụ về tính khoảng tin cậy

Máy tính độ lệch chuẩn

Công cụ máy tính độ lệch chuẩn trực tuyến giúp bạn dễ dàng tính toán độ lệch chuẩn của một tập hợp dữ liệu bất kỳ. Không chỉ vậy, công cụ này còn cung cấp các thông số thống kê quan trọng khác, bao gồm giá trị trung bình và phương sai. Máy tính cũng hỗ trợ xác định khoảng tin cậy của tập dữ liệu ở nhiều mức độ tin cậy khác nhau, đồng thời cung cấp bảng phân phối tần số trực quan.

Để sử dụng công cụ máy tính này, bạn chỉ cần nhập các số liệu đã cho vào ô dữ liệu, phân tách mỗi số bằng một dấu phẩy. Sau đó, chọn xem các số đó đại diện cho một tổng thể (Population) hay một mẫu (Sample), và nhấn "Tính toán" (Calculate) để nhận kết quả ngay lập tức.

Độ lệch chuẩn

Độ lệch chuẩn là một đại lượng thống kê cốt lõi, dùng để đo lường mức độ phân tán hoặc biến thiên của một tập dữ liệu cho trước. Nó cho biết khoảng cách trung bình tổng hợp của các điểm dữ liệu so với giá trị trung bình của toàn bộ tập dữ liệu. Độ lệch chuẩn càng nhỏ, các điểm dữ liệu càng tập trung sát với giá trị trung bình (ít biến động). Ngược lại, độ lệch chuẩn càng lớn, các điểm dữ liệu càng phân tán xa khỏi giá trị trung bình (biến động cao). Trong toán học, độ lệch chuẩn chính là căn bậc hai của phương sai.

Đại lượng này được tính toán dựa trên tính chất của tập dữ liệu gốc. Nếu tập dữ liệu bao gồm toàn bộ các điểm dữ liệu cần nghiên cứu, nó được gọi là độ lệch chuẩn của tổng thể. Tuy nhiên, nếu tập dữ liệu chỉ là một phần được trích xuất từ tổng thể lớn hơn, nó được gọi là độ lệch chuẩn của mẫu.

Độ lệch chuẩn của Tổng thể

Độ lệch chuẩn của tổng thể được tính toán khi tập dữ liệu của bạn đại diện cho một tổng thể hoàn chỉnh. Điều này có nghĩa là tập dữ liệu bao gồm tất cả các quan sát đang được xem xét. Đại lượng này thường được ký hiệu bằng chữ σ.

σ là chữ cái viết thường của ký tự Hy Lạp Sigma. Độ lệch chuẩn của tổng thể được xác định bằng công thức sau:

$$\sigma=\sqrt{\frac{\sum_{i=1}^{N}{(x_i-\mu)^2}}{N}}$$

Trong đó:

  • Σ là chữ cái Hy Lạp Sigma viết hoa, được sử dụng để biểu diễn phép tính tổng trong toán học;
  • xᵢ biểu thị từng điểm dữ liệu (mỗi quan sát trong tập dữ liệu), tính từ điểm dữ liệu đầu tiên đến điểm dữ liệu thứ N (cuối cùng);
  • μ biểu thị giá trị trung bình của tổng thể;
  • n là kích thước (số lượng phần tử) của tổng thể.

Ví dụ về cách tính độ lệch chuẩn của tổng thể

Ví dụ thực tế dưới đây sẽ minh họa chi tiết cách tính độ lệch chuẩn cho dữ liệu tổng thể.

Các nhà đầu tư thường coi cổ phiếu là một loại tài sản có rủi ro cao do độ biến động giá trị lớn hơn so với các kênh đầu tư khác. Giả sử, một nhà quản lý quỹ muốn phân tích sự biến động của một mã cổ phiếu trong tháng vừa qua. Nguyên tắc của ông là sẽ không khuyến nghị cho khách hàng bất kỳ cổ phiếu nào có độ lệch chuẩn lớn hơn hoặc bằng giá trị trung bình của chính nó, vì mức độ đó được đánh giá là "quá rủi ro".

Dưới đây là thống kê toàn bộ giá đóng cửa hàng ngày (tính theo USD) của cổ phiếu đó trong tháng trước. Hãy tính độ lệch chuẩn và xác định xem nhà quản lý có đánh giá cổ phiếu này là "quá rủi ro" hay không:

1,31, 1,30, 1,36, 1,40, 1,40, 1,41, 1,27, 1,19, 1,15, 1,12, 0,99, 1,00, 0,97, 0,94, 0,88, 0,90, 0,86, 0,88, 0,80, 0,81

Lưu ý rằng nhà quản lý chỉ quan tâm đến lịch sử giá cổ phiếu của tháng trước, và danh sách trên đã bao gồm tất cả các mức giá của tháng đó. Do vậy, chúng ta đang có một dữ liệu tổng thể hoàn chỉnh. Vì thế, chúng ta sẽ áp dụng công thức tính độ lệch chuẩn của tổng thể.

Để tìm độ lệch chuẩn, bước đầu tiên là tính giá trị trung bình. Nhắc lại, giá trị trung bình μ được tính bằng cách lấy tổng tất cả các số liệu chia cho tổng số lượng các số đó.

$$\mu=\frac{1,31+1,30+1,36+1,40+1,40+1,41+1,27+1,19+1,15+1,12+0,99+1,00+0,97+0,94+0,88+0,90+0,86+0,88+0,80+0,81}{20 }=1,097$$

Tiếp theo, lấy từng số liệu trừ đi giá trị trung bình, sau đó bình phương các độ lệch này. Cộng tất cả các kết quả lại và chia cho số lượng phần tử. Kết quả thu được chính là phương sai σ².

$$\sigma^2=\frac{\left(1,31-1,097\right)^2+\left(1,30-1,097\right)^2+\left(1,36-1,097\right)^2+\left(1,40 -1,097\right)^2+\ldots+\left(0,81-1,097\right)^2}{20}=0,045031$$

Cuối cùng, lấy căn bậc hai của phương sai, ta sẽ được độ lệch chuẩn.

$$\sigma=\sqrt{0,045031}\approx0,21$$

Như bạn có thể thấy, độ lệch chuẩn về mức giá của cổ phiếu này trong tháng trước (0,21) nhỏ hơn nhiều so với giá trị trung bình của nó (1,097). Do đó, nhà quản lý quỹ sẽ không coi cổ phiếu này là "quá rủi ro".

Độ lệch chuẩn của Mẫu

Độ lệch chuẩn của mẫu được sử dụng khi tập dữ liệu chỉ là một tập hợp con (một mẫu) đại diện cho một tổng thể lớn hơn. Tập dữ liệu này chứa một số lượng phần tử ít hơn so với toàn bộ các phần tử có thể được xem xét. Độ lệch chuẩn của mẫu thường được ký hiệu là s và được tính theo công thức sau:

$$s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_i-\bar{x}\right)^2}{n-1}}$$

Trong đó:

  • Σ biểu thị phép tính tổng;
  • xᵢ biểu diễn từng điểm dữ liệu cụ thể;
  • biểu diễn giá trị trung bình của mẫu;
  • n là kích thước (số lượng phần tử) của mẫu.

Chúng ta sẽ sử dụng lại ví dụ về nhà quản lý đầu tư để minh họa cách tính độ lệch chuẩn của dữ liệu mẫu. Giả sử trong tình huống này, nhà quản lý không thể truy cập vào toàn bộ giá đóng cửa của tất cả các ngày giao dịch trong tháng trước. Thay vào đó, ông chỉ có dữ liệu giá đóng cửa của một vài ngày ngẫu nhiên. Lúc này, ông sẽ phải ước lượng độ lệch chuẩn của giá cổ phiếu bằng cách sử dụng dữ liệu từ tập mẫu hiện có.

Giả sử ông có được dữ liệu giá đóng cửa của 5 ngày như sau:

1,31, 1,40, 0,86, 0,88, 1,40

Dù mục tiêu của nhà quản lý vẫn là đánh giá biến động giá cổ phiếu trong toàn bộ tháng trước, nhưng vì ông không có đủ toàn bộ dữ liệu mà chỉ có 5 mức giá đóng cửa, chúng ta đang làm việc với một tập dữ liệu mẫu. Do đó, chúng ta phải sử dụng công thức tính độ lệch chuẩn của mẫu.

Đầu tiên, tính giá trị trung bình của mẫu.

$$\bar{x}=\frac{1,31+1,40+0,86+0,88+1,40}{5}=1,17$$

Tiếp theo, tính phương sai . Chú ý ở bước này mẫu số sẽ là n-1.

$$s^2=\frac{\left(1,31-1,17\right)^2+\left(1,40-1,17\right)^2+\left(0,86-1,17\right)^2+\left(0,88- 1,17\right)^2+\left(1,40-1,17\right)^2}{5-1}=0,0764$$

Cuối cùng, lấy căn bậc hai của phương sai để tìm ra độ lệch chuẩn.

$$s=\sqrt{0,0764}\approx 0,28$$

Biên độ sai số

Một trong những ứng dụng quan trọng nhất của độ lệch chuẩn là tính toán phạm vi các giá trị "có thể chấp nhận được". Kỹ thuật này đóng vai trò cốt lõi trong việc đảm bảo chất lượng thống kê công nghiệp và phân tích dự đoán dữ liệu. Nếu dữ liệu cơ sở tuân theo quy luật phân phối chuẩn, phạm vi này được gọi là khoảng tin cậy (sẽ được trình bày chi tiết ở phần tiếp theo). Các khoảng tin cậy thường được biểu diễn ở nhiều mức độ tin cậy (tính theo phần trăm) khác nhau.

Biên độ sai số (Margin of Error) là một thành phần thiết yếu tạo nên độ rộng của khoảng tin cậy. Hiểu một cách đơn giản, biên độ sai số cho biết khoảng chênh lệch tối đa và tối thiểu có thể chấp nhận được của đại lượng đang nghiên cứu.

Biên độ sai số (hay lề lỗi) được tính bằng công thức:

$$Lề\ lỗi\ = z_{\alpha/2}\left(\dfrac{\sigma}{\sqrt{n}}\right)$$

Chúng ta áp dụng công thức này nếu đã biết độ lệch chuẩn của tổng thể, σ. Đồng thời, kích thước mẫu phải đủ lớn (thông thường n>30).

Trong trường hợp chưa biết độ lệch chuẩn của tổng thể và kích thước mẫu nhỏ (thường là n≤30), chúng ta sẽ sử dụng công thức sau:

$$Sai\ số\ biên\ = t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Ở công thức này, chúng ta sử dụng độ lệch chuẩn của mẫu s để thay thế vì độ lệch chuẩn tổng thể σ chưa được biết.

Các giá trị \$z_{\alpha/2}\$ và \$t_{n-1, \alpha/2}\$ được xác định thông qua thống kê z và thống kê t, thường được gọi là các giá trị tới hạn. Chúng là những hằng số gắn liền với từng mức độ tin cậy cụ thể.

Trong thống kê, các mức khoảng tin cậy được sử dụng phổ biến nhất là 90%, 95% và 99%. Tương ứng với đó, giá trị \$z_{\alpha/2}\$ sẽ là 1,645 (đối với 90%), 1,96 (đối với 95%) và 2,575 (đối với 99%).

Thành phần \$\frac{\sigma}{\sqrt n}\$ hoặc \$\frac{s}{\sqrt n}\$ được gọi là sai số chuẩn (Standard Error).

  • \$\frac{\sigma}{\sqrt n}\$ được sử dụng khi chúng ta đã biết độ lệch chuẩn của tổng thể σ và có một tập mẫu lớn (thường là n>30).
  • \$\frac{s}{\sqrt n}\$ được sử dụng khi chúng ta không biết độ lệch chuẩn của tổng thể và chỉ có một tập mẫu nhỏ (thường là n≤30). Điều này có nghĩa là, thay vì dùng độ lệch chuẩn tổng thể σ, chúng ta sử dụng độ lệch chuẩn từ mẫu dữ liệu sẵn có s.

Khoảng tin cậy

Như đã đề cập ở trên, khoảng tin cậy là một phạm vi giá trị mà một đại lượng thống kê được kỳ vọng sẽ rơi vào, tương ứng với một mức độ tin cậy (xác suất) nhất định.

Ví dụ: Dựa trên dữ liệu, chúng ta có thể kết luận rằng chiều cao của các bé gái 13 tuổi nằm trong khoảng từ 59 inch đến 66 inch với mức độ tin cậy là 90%. Điều này có nghĩa là, nếu chúng ta chọn ngẫu nhiên một nhóm các bé gái 13 tuổi, có khoảng 90% khả năng chiều cao của các em sẽ nằm trong khoảng giá trị đã dự báo.

Khoảng tin cậy được tính theo công thức:

$$\bar{x}± z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)$$

  • là giá trị trung bình của mẫu,
  • \$z_{\alpha/2}\$ là giá trị tới hạn,
  • σ là độ lệch chuẩn của tổng thể,
  • n là số lượng phần tử.

Một công thức khác được sử dụng trong trường hợp chúng ta không biết độ lệch chuẩn của tổng thể σ và buộc phải thay thế bằng độ lệch chuẩn của mẫu s:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • là giá trị trung bình của mẫu,
  • \$t_{n-1,\alpha/2}\$ là giá trị tới hạn,
  • s là độ lệch chuẩn của mẫu,
  • n là số lượng phần tử.

Dựa vào các phần trước, chúng ta có thể dễ dàng nhận ra rằng \$z_{\alpha/2}\left(\frac{\sigma}{\sqrt{n}}\right)\$ và \$t_{n-1,\alpha/ 2}\left(\frac{s}{\sqrt{n}}\right)\$ chính là các biên độ sai số.

Ví dụ về tính khoảng tin cậy

Giả sử chúng ta biết rằng mức giá cổ phiếu hàng ngày đang xem xét tuân theo quy luật phân phối chuẩn. Chúng ta có một mẫu giá cổ phiếu như sau:

1,31, 1,36, 1,40, 1,27, 1,15, 0,99, 0,97, 0,88, 0,86, 0,80

Yêu cầu đặt ra là cần tính toán xem mức giá cổ phiếu sẽ dao động trong phạm vi nào với độ tin cậy 95%.

Vì đây là một tập mẫu nhỏ và chúng ta không biết độ lệch chuẩn của tổng thể, chúng ta sẽ sử dụng độ lệch chuẩn của mẫu cùng với công thức tính khoảng tin cậy tương ứng:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

  • là giá trị trung bình của mẫu, bằng 1,10
  • \$t_{n-1,\alpha/2}$ là giá trị tới hạn, cụ thể \$t_{9, 0,025}\$ = 2,26 (giá trị tới hạn đối với một cỡ mẫu và mức độ tin cậy cụ thể này thường được tra từ bảng z hoặc bảng t chuẩn)
  • s là độ lệch chuẩn của mẫu, bằng 0,23
  • n là số lượng phần tử, bằng 10,
  • \$\frac{s}{\sqrt n}\$ là sai số chuẩn \$\frac{0,23}{\sqrt{10}}=0,07\$

Đưa các thông số này vào công thức:

$$\bar{x}± t_{n-1,\alpha/2}\left(\frac{s}{\sqrt{n}}\right)$$

Chúng ta sẽ có các phép tính:

$$1,10 - 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 - 2,26 (\frac{0,23}{3,16}) = 1,10 - 2,26 × 0,07 = 1,10 - 0,16 = 0,94$$

$$1,10 + 2,26 (\frac{0,23}{\sqrt{10}}) = 1,10 + 2,26 (\frac{0,23}{3.16}) = 1,10 + 2,26 × 0,07 = 1,10 + 0,16 = 1,26$$

Kết quả này có nghĩa là chúng ta có thể chắc chắn 95% rằng giá cổ phiếu trung bình sẽ nằm trong khoảng tin cậy (0,94, 1,26).