Spark DataFrameに新しい列を追加する

Scala

下記のようにUDF使うか, mapでDataFrameごと新しくするか、なのか？ import spark.implicits._ import org.apache.spark.sql.functions._ // Example data val df = Seq( (1, 2), (3, 4), (5, 6) ).toDF("x", "y") // Define function val hoge = udf({(x: I…

2016-03-12

標準入力を受け取りたい

Scala

そういう時もある。書き方結構あるなぁ。書き方1 import scala.io.StdIn.readLine object Main { def main(args: Array[String]){ val Array(a, b) = readLine().split(" ").map(_.toInt) println((a,b)) val s = readLine() println(s) } } 実行例 $ scala…

2016-01-31

Scalaのforは直積集合を作るのに便利

Scala

scala> for(x <- 1 to 3; y <- 1 until 5){println(x + " " + y)} 1 1 1 2 1 3 1 4 2 1 2 2 2 3 2 4 3 1 3 2 3 3 3 4 これはイケてる。

2016-01-24

Apache Sparkでコール・オプション価格の分散処理計算 with Google Cloud Dataproc

Scala 金融工学

モンテカルロ法でコール・オプション価格 - My Life as a Mock Quantを流行りの分散処理環境Apache Sparkでやってみたという話。コード書くのは一瞬なんだけど、依存関係周りの解消が辛かったので、積極的にコード残しておきたい。下記コード+sbtファイルを…

2016-01-18

モンテカルロ法でコール・オプション価格

Scala 金融工学

とりあえず慣れてるのからということで・・・Wolfram Alphaで出した結果と大体あってるので、これでよさげだ。 import scala.util.Random import scala.math object App { def main(args: Array[String]) = { val random = new Random() // Monte Carlo sett…

2016-01-12

applyは()の糖衣構文なのか？

Scala

そういうことっぽい。 scala> Seq(1,2,3) res0: Seq[Int] = List(1, 2, 3) scala> Seq.apply[Int](1,2,3) res1: Seq[Int] = List(1, 2, 3) 参考第22章：Scalaの抽出子

2016-01-03

ActivatorのTemplateで"reference to fork is ambiguous"を食らうケースがある

Scala

Scalaおじさんにもなってきたので、マメにハマりをめも。Typesafe Activator使ってScalaしてて、Hello PlayFramework的なTutorialが動かなくてこまった。同じ症状の人はこちら。 https://github.com/typesafehub/activator/issues/1060 要するに、build.sbt…