Tiền tài biết đủ, thân không nhục - Danh lợi không tham, đức mới cao - Đời không sóng gió, tâm không sáng - Đạo chẳng gian nan đạo chẳng thành

Thứ Tư, 4 tháng 6, 2008

HƯỚNG DẪN SỬ DỤNG SPSS

Hướng dẫn sử dụng phần mềm SPSS
SPSS Là phần mềm chuyên dụng xử lý thông tin sơ cấp - thông tin được thu thập trực tiếp từ đối tượng nghiên cứu. Thông tin được xử lý là thông tin định lượng (có ý nghĩa về mặt thống kê).Phần mềm SPSS có tất cả 4 dạng màn hình:
Data view : Màn hình quản lý dữ liệu
                Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng
Variables view : Màn hình quản lý biến
                        Là nơi quản lý các biến cùng với các thông số liên quan đến biến như:
Name (Tên biến) : Là tên đại diện cho biến, tên biến này sẽ được hiễn thị trên đầu mỗi cột trong màn hình dữ liệu
Type (Loại biến ): Có dạng số và dạng chuỗi
Label (Nhãn của biến): Tên biến chỉ được thể hiện tóm tắc bằng ký hiệu, nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến.
Values (Giá trị trong biến ): Cho phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)
Missing (Giá trị khuyết): SPSS mặc định giá trị khuyến (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi các phân tích thống kê.
Measures (Dạng thang đo): Hiễn thị dạng thang đo của giá trị trong biến

Màn hình hiễn thị kết quả (output):
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồi thị và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ra một màn hình, và được lưu giữ dưới một tập tin khác (có đuôi là .SPO). Màn hình này cho phép ta xem và lưu giữ các kết quả phân tích.
Màn hình cú pháp (syntax):  Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh phân tích. Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cần thao tác các lệnh phân tích lại.
1. Tạo biến và nhập dữ liệu trên SPSS
    Tạo biến trong màn hình quản lý biến : Nhấp vào Variables view
    Name: Gõ tên biến cần khai báo
    Type: Kiểu biến
    Variable Label: Đặt tên nhãn cho biến một cách đầy đủ hơn
    Value lables : Định tên cho các giá trị trong biến
     Missing Values: Được dùng để định ra các giá trị cụ thể cho các giá trị mà ta muốn loại bỏ ra khỏi các phân tích và xử lý thống kê
     Column: Định ra chiều rộng của cột đang khai báo biến
     Align: Canh lề
     Measurement: Chọn loại thang đo
Nhập dữ liệu
Nhập trực tiếp trên sps hay cũng có thể nhập liệu từ các phần mềm khác như Excel, Fox, … và sau đó chuyển vào trong SPSS thông qua Menu Fileàopen
Công cụ tính toán giữa các biến (Compute)
                Công cụ compute được dùng để tính toán giữa các giá trị trong các biến và kết quả sẽ được lưu giữ trong một biến mới hoặc là một biến khác sẳn có hoặc biến chứa đựng giá trị đang tính toán. Để thực hiện công cụ này ta vào Menu Transform àCompute : Xuất hiện:

Mục Target variable : Tên biến sẽ nhận giá trị được tính
Ô Numeric Expressionn: chứa các biểu thức số được dùng để tính giá trị cho biến mới. Chúng ta có thể soạn các biểu thức tính toán vào thẳng ô Numeric Expression, và có thể sữ dụng các công cụ được hiển thị trong hộp thoại như các phiếm (+), (-), Function,…
Công cụ if : Dùng để định ra những điều kiện cần thiết kèm theo trong tính toán nếu có
2. Xử lý và phân tích dữ liệu
Kiểm tra dữ liệu (Explore)
SPSS cung cấp cho công cụ Explore để xem xét và kiểm tra dữ liệu:
· Phát hiện các sai sót
· Nhận dạng dữ liệu để tìm phương pháp phân tích thích hợp và chuẩn bị cho việc kiểm tra giả thuyết
Để kiểm tra dữ liệu, chọn trên menu AnalyzeàDescriptiveStatisticà Explore… để mở hộp thoại Explore như hình sau:

Dependent list: Đưa các biến cần kiểm tra vào đây.
Display : Cho phép chúng ta chọn cách hiễn thị kết quả.
Statistics : Cho phép ta lựa chọn các thống kê hiễn thị như :
Descriptives : Hiễn thị các giá trị thống kê như giá trị trung bình, khoảng tin cậy, trung vị, trung bình giãn lược, giá trị nhỏ nhất, lớn nhất, khoảng biến thiên, các bách phân vị
M-estimators: Hiễn thị các giá trị trung bình theo 4 loại trọng số
Outliers: Hiễn thị các quan sát có 5 giá trị nhỏ nhất và 5 giá trị lớn nhất, gọi là Extreme Values
Percentiles: Hiển thị các giá trí bách vị phân
Kiểm nghiệm Kolmogorov-Smirnov (Lilliefors)
Kiểm nghiệm Kolmogorov-Smirnov, dùng để kiểm nghiệm tính chuẩn tắc của một mẫu hay hai mẫu.
Kiểm nghiệm Levene
Kiểm nghiệm Levene là phép kiểm nghiệm tính đồng nhất của phương sai. Ở đây ta kiểm nghiệm giả thuyết cho rằng phương sai của giữa các mẫu quan sát là bằng nhauLập bảng phân bố tần suất cho biến một trả lời (Frequencies)

3. Kiểm Định Mối Liên Hệ
a. Kiểm định mối liên hệ giữa hai biến Định danh-định danh,định danh-định thức (H o : hai biến không có liên hệ gì với nhau)
Người ta dùng Kiểm định Chi-square để kiểm tra xem liệu một biến này có quan hệ hay không với một biến khác, tuy nhiên phương pháp kiểm nghiệm này không chỉ ra cường độ của mối quan hệ giữa hai biến mạnh hay yếu giữa 2 biến, các hệ số trong kiểm nghiệm Chi_square như sau:
· Hệ số Pearson Chi-square và Likelihood Ratio cho biết có mối liên hệ giữa hai biến định tính hay không (sig rất nhỏ)
· Hệ số Linear-by-linear association Đo lường mối liên hệ tuyến tính giữa hai biến.(hữu dụng khi hàng cột xếp theo thứ tự tăng dần)
· Chỉ số Continuity Correction đánh giá mối tương quan giữa hai biến (dạng 2 x 2)trong bảng.
Cách thực hiện trong SPSS: vào AnalyzeàDescriptive Statiticsà Crosstab
Hiện hộp thoại, trong đó ta đưa hai biến cần kiểm tra vào 2 ô : Row và Column sau đó nhấn ok là xong.
Ta có thể vào trong phần Statistic để chọn các thông số thống kê:
Nornimal: dùng cho 2 biến định danh.
Ordinal : dùng cho 2 biến dạng thứ bậc.
Trong phần Cells: tương tự, hãy vào mà khám phá nó.
b. Kiểm định mối liên hệ giữa hai biến Thứ Bậc
Phát biểu giả thuyết Ho : không có mối liên hệ nào giữa các biến trong tổng thể
Thực hiện trong SPSS : AnalyzeàDescriptive Statiticsà Crosstab,
Đưa biến vào 2 ô : Row và Column , nhấn vào Statistics và chọn : Chi square, correlation, gamma, somer’s , tau_b..
c. Kiểm định mẫu đang xét có là phân phối chuẩn không
Phát biểu giả thuyết Ho : Độ sai lệch của tổng thể 2 giá bất động sản là phân phối chuẩn(tức giá trị dự báo đáng tin cậy).
Ứng dụng : Kiểm định này dùng để kiểm định giả thuyết phân phối của dữ liệu có phù hợp với phân phối lý nthuyết .nó tiến hành xem xét các sai lệch giữa Giá trị cũ và giá trị mới của bất động sản, sai lệch tuyệt đối càng lớn ,giả thuyết Ho càng dễ bị bác bỏ.
Cách thực hiện:
Bước 1: TransformàCompute , hiện hộp thoại:
Nhập tên biến mới vào khung : Target Variabel
Khung Numberic Expression : ta nhập : giáBĐS_dựBáo – Giá BĐScũ
Sau đó nhấn ok.
Bước 2 : AnalyzeàNonparametric Testà1 _ sample K S xuất hiện hộp thoại sau:
Đưa biến mới tạo bước 1 vao khung Test Variable List
Phần Test Distribution : ta chọn loại phân phối chuẩn (Normal) , nhấn OK là xong.
4. Tương Quan
Ở phần trước chúng ta đã dùng một số công cụ để đo lường mối liên hệ giữa các biến với nhau. Tuy nhiên kỷ thuật đó chủ yếu dùng cho dữ liệu định tính.Còn đối với các dữ liệu định lượng ta thường dùng hệ số tương quan R., hay biểu đồ phân tán Scatter.
a. Xác định hệ số tương quan:
Cách thực hiện trên SPSS : Vào menu Analyzeà chọn CorrelateàChọn Bivarlate , xuất hiện hộp thoại :
Khung Variables : ta đưa các biến cần xét mối tương quan vào.
Khung Correction Coefficients : chọn Person và Spearman
Nhấn vào Option để giải quyết các trường hợp thiếu số liệu của biến đại khái như sau:
Phần Statisc : khai báo có tính hay không tính Trung bình_độ lệch chuẩn và tổng tích các môdun chéo_hiệp phương sai.
Phần Misssing Value : khai báo xử lý các trường hợp thiếu của biến
Exclude case pairwise : xử lý từng cặp, loại giá trị thiếu ra khỏi cặp so sánh,nhưng vẫn dùng cho cặp khác nếu với cặp khác nó không thiếu.
Exclude case listwise : mẫu nào thiếu giá trị sẽ bị SPSS loại hẳn ra khỏi cuộc chơi.
b. Vẽ biểu đồ Scater
Ý nghĩa của biểu đồ : Biểu đồ này cũng có mục đích giúp ta có cái nhìn trực quan về mối liên hệ giữa các biến.Nếu như Hệ số hồi quy R cho ta biết giữa hai biến đó có tương quan không, trường hợp các biến có tương quan thì không nói, nhưng nếu kết quả R cho thấy các biến không có liên hệ với nhau thì lúc này Biểu đồ Scatter sẽ cho ta biết "sự không có mối tương quan giữa các biến" là thật sự vì chúng hoàn toàn độc lập nhau, hay chúng không có mối liên quan bỡi vì chúng không có mối liên hệ tuyến tính mà chúng sẽ liên hệ theo một loại quan hệ nào đó, phi tuyến chẳng hạn.
Cách thực hiện :
Vào menu Graphs à chọn Scatter..--> Chọn simpleà Chọn Define , xuất hiện hộp thoại
Đưa 2 biến cần vẽ, một vào Y_axis, một vào X_axis
Title : dùng để đặt tiêu đề, ghi chú cho biểu đồ
Option : dùng để khai báo cách xử lý những giá trị thiếu của biến quan sát.
5. Hồi Quy Tuyến Tính
Ý nghĩa : Qua một loạt các kiểm tra, nếu kết luận được các biến có liên quan tuyến tính hay có liên quan phi tuyến với nhau. Thì bước tiếp theo chúng ta tiến hành xây dựng hàm hồi quy. Hàm hồi quy này có ý nghĩa cho chúng ta biết sự đóng góp của từng biến trong biến phụ thuộc hay nói cách khác giá trị của biến phụ thuộc đóng góp bao nhiêu phần trăm trong tổng giá trị của biến phụ thuộc, và nó còn cho chúng ta biết sự thay đổi một đơn vị của nó,sẽ kéo theo sự thay đổi của biến phụ thuộc là bao nhiêu.
Cách thực hiện :
Vào menu Analyze à Regression à Linear…, hiện hộp thoại:
· Khung Dependent : Đưa biến mà ta muốn nó làm biến phụ thuộc vào
· Khung Independent : Đưa các biến độc lập vào đây.
· Phần method : lựa chọn phương pháp đưa biến vào:
Enter : đưa một lượt các biến vào một lúc.
Remove: loạt tất cả các biến ra khỏi hàm 1 lượt, tất nhiên đầu tiên phải đưa các biến vào trước mới có cái để gỡ ra chứ.
Forward : Phương pháp đưa vào dần ,biến 1 được đưa vào là biến có tương quan lớn nhất,nếu thỏa tiêu chuẩn vào : FIN hay PIN, thì biến tiếp theo được đưa vào…..Quá trình này dừng lại khi không còn biến nào thỏa tiêu chuẩn vào.
Backward : Loại trừ dần từng biến ra khỏi mô hình, đầu tiên biến ít liên quan nhất sẽ được đưa ra khỏi mô hình theo tiêu chuẩn "Loại Trừ: FOUT hay POUT".Quá trình này dừng lại khi giá trị F của biến có hệ số tương quan nhỏ nhất > FOUT.
Stepwise : Chọn dần từng bước.Đây là phương pháp kết hợp của 2 phương pháp Forward và Backward (Điều kiện để cho các biến không bị đưa ra rồi đưa vào lập lại thì ta chọn :FIN>FOUT hay PIN >), thì Phương sai không đổi.
c. Kiểm Định Giả Thuyết Về Phân Phối Chuẩn Của Phần Dư
Thực hiện : (dùng history hay Q_Qplots dều được)
Bước 1 : thực hiện hồi quy và lưu lại biến phần dư chuẩn hóa
Bước 2 : vẽ biểu đồ History : Graph à History à đưa biến phần dư vào ô Variable, nhấp chọn ô Display normal curve.
Bước 4 : kết luận, nếu Mean= 0,00 và Std.Dovà 1 thì kết luận là PPC.
d. Kiểm Định Giả Thuyết Về Tính ĐA CỘNG TUYẾN
Thực hiện :
Bước 1 : Chạy hàm hồi quy ,nhưng trước khi nhấn OK, hãy nhấn vào Nút Statistics và chọn COLLINEARITY DIAGNOSTICS
Bước 2 : Kết luận : Nếu Độ chấp nhận nhỏ hay VIF > 10 thì có đa cộng tuyến.
Nguyễn Mạnh Hùng_DH04TB - Khoa QLTTBĐS – ĐH Nông Lâm

Không có nhận xét nào:

Đăng nhận xét