Analisis

Membangun Model Expected Goals (xG)

Google+ Pinterest LinkedIn Tumblr

Sepak bola terus berkembang seiring berjalannya waktu. Sepak bola bukan hanya lagi soal pertandingan sebelas lawan sebelas di dalam lapangan. Di luar lapangan, olahraga tersebut terus bersinggungan dengan bidang lain. Salah satunya adalah statistik.

Statistik memiliki kekuatan empiris dan faktual dalam melihat suatu permasalahan. Namun, ilmu statistik dalam sepak bola harus bisa memasukkan konteks permainan.

Hal itu membuat pengolahan data mentah statistik sepak bola menjadi perlu dan penting. Salah satu metrik dalam statistik sepak bola yang dianggap banyak orang memiliki konteks adalah Expected Goals.

Expected Goals (xG) adalah perhitungan statistik mengenai kualitas sebuah peluang. Metrik itu dapat digunakan sebagai salah satu tolak ukur penampilan sebuah tim.

Dalam pertandingan, performa tim sering tidak berbanding lurus dengan hasil akhir. Di sini xG mampu memberikan kisah tambahan tentang performa tim dalam pertandingan tersebut.

Data dan Keterbatasannya

Dalam percobaan untuk membuat model Expected Goals tersebut digunakan data pertandingan Liga 2 2018. Tidak semua pertandingan, hanya pertandingan PS Sleman dan pertandingan lain yang berhubungan dengan Super Elja.

Data sendiri dikoleksi oleh tim SF Stats saat bekerja sama dengan PSS pada musim tersebut. Kami menggunakan data tersebut untuk pembuatan model karena memiliki asumsi bahwa kualitas liga berpengaruh terhadap hasil pemodelan yang akan dilakukan.

Selain masih terbatasnya jumlah data, detail data yang dikumpulkan juga masih sederhana. Sehingga pembuatan model itu kita batasi pada model Expected Goals pada situasi open play. Data tembakan yang berasal dari situasi set pieces (corner, freekick, dan penalti) tidak dimasukkan ke dalam proses pembuatan model.

Formulasi Model dan Variabel yang Digunakan

Sebagai langkah awal, kami menggunakan dua variabel, jarak dan sudut tembakan, untuk memformulasikan model Expected Goals. Dua variabel tersebut digunakan berdasarkan alasan yang logis dan mendasar pada sepakbola.

Berdasarkan jarak tembakan, secara logis kita semua sepakat bahwa tembakan yang dilepaskan dari jarak dekat memiliki kemungkinan lebih besar untuk menjadi gol dibandingkan dengan tembakan yang dilepaskan dari jarak yang jauh dari gawang. Nilai jarak dihitung dari titik tembak ke titik tengah gawang.

Gambar 1. Pengukuran nilai jarak

Sedangkan untuk perhitungan variabel sudut, bisa dilihat pada Gambar 2 untuk penjelasannya. Jadi, sudut tembakan didefinisikan sebagai sudut yang diebntuk antara titik tembak dan tiang gawang. Nilai sudut didapatkan dengan menggunakan perhitungan trigonometri sederhana.

Gambar 2. Pengukuran nilai sudut

Tembakan dengan nilai sudut yang lebih besar memiliki peluang untuk menjadi gol lebih besar dibandingkan dengan tembakan yang memiliki nilai sudut yang kecil. Lebih lanjut, nilai sudut itu juga untuk mengoreksi variabel jarak.

Meski jarak dengan gawang dekat, tembakan yang dilepaskan dari sudut sempit tentu memiliki peluang untuk menjadi gol yang lebih kecil. Dari perhitungan tersebut juga kita bisa mendapatkan nilai sudut yang sama walaupun dengan jarak ke gawang yang berbeda.

Dari Gambar 3, kita bisa melihat hubungan empiris antara jarak dan sudut terhadap probabilitas gol. Pada grafik jarak, terlihat menurunnya probabilitas gol seiring dengan bertambahnya jarak tembak.

Situasi sebaliknya terjadi pada hubungan sudut dengan probabilitas gol. Semakin besar sudut tembak, probabilitas gol semakin naik.

Gambar 3. Kurva hubungan antara jarak dengan probabilitas gol (kiri) dan kurva hubungan antara sudut dengan probabilitas gol (kanan)

Data yang diperoleh kemudian akan diproses dengan menerjemahkannya ke dalam masalah statistik atau matematika. Model statistik atau matematika tersebut dapat memberikan pemahaman lebih terhadap masalah yang diuji, dan mampu digunakan untuk memperkirakan hal yang dapat terjadi ke depan.

Dalam permasalahan tersebut, persamaan logistik digunakan untuk melakukan fitting terhadap kedua data di atas. Hasil kurvanya dapat dilihat di Gambar 3.

Salah satu alasan dipilihnya model logistik adalah sifatnya yang memiliki nilai antara 1 dan 0. Sifat binomial itu sesuai untuk melakukan perhitungan probabilitas untuk mencetak gol, dengan nilai 1 menunjukkan gol dan nilai 0 menunjukkan gol tidak terjadi.

Secara sederhana, fitting dilakukan untuk mencari nilai koefisien pada persamaan logistik berdasarkan data yang digunakan.

Terdapat beberapa nilai yang tidak sesuai dengan kurva, terutama pada grafik sudut terhadap probabilitas gol. Salah satu penyebabnya adalah tidak banyaknya tembakan yang dilepaskan pada sudut tersebut pada data yang digunakan.

Gambar 4. Persamaan Logistik

Langkah selanjutnya adalah memasukkan kedua variabel tersebut dalam pemodelan logistik untuk mendapatkan model expected goals. Probabilitas untuk mencetak gol sebagai fungsi jarak dan sudut dapat dilihat pada Gambar 5. Warna hijau pekat menunjukkan nilai xG lebih besar atau sama dengan 0,3.

Gambar 5. Probabilitas mencetak gol sebagai fungsi dari jarak dan sudut
Tahap Lanjutan

Dalam proses pembuatan penulis sadar bahwa model Expected Goals ini masih jauh dari model yang baik. Jumlah data yang belum terlalu banyak menjadi salah satu alasan utama.

Namun, sebagai langkah awal, model itu akan sangat berguna. Terutama dalam menentukkan langkah selanjutnya yang perlu dikerjakan untuk memoles model xG tersebut.

Gambar 6. Peta tembakan dari situasi open play dari dua pertandingan PSS melawan PSIM pada Liga 2 2018 dengan menunjukkan nilai xG (tanda silang menunjukkan gol)

Gambar 7. Peta tembakan dari situasi open play dari pertandingan PSS melawan Semen Padang FC pada laga final Liga 2 2018 dengan menunjukkan nilai xG (tanda silang menunjukkan gol)

Pengumpulan lebih banyak data akan menjadi hal utama yang perlu dilakukan ke depan. Fokus pengumpulan data sendiri akan terbagi menjadi dua.

Pertama, pengumpulan data untuk menambah jumlah data historis. Hal itu akan memudahkan dalam membuat model xG dalam situasi yang lain, seperti model xG untuk freekick, corner, penalti, dan tembakan dari sundulan.

Fokus kedua adalah pengumpulan data untuk menambah variabel yang dimasukkan ke dalam pemodelan. Jenis umpan yang dilepaskan ke pemain yang melakukan tembakan dan situasi serangan (bangun serangan atau serangan balik) bisa menjadi variabel tambahan untuk diperiksa dalam membangun model expected goals tersebut.

Komentar
Dani Rayoga

Football Addict | Physics Lovers | @DaniBRayoga

Comments are closed.