Loading data from .csv file #135

GearFear · 2016-11-17T11:48:37Z

I try to load data from mlsd datasets for k-means clustering on GPU.

I call:
val (mm, opts) = KMeans.learner("data/MLSD/mlsd1_4898430_38_20.csv")
opts.dim = 20
opts.batchSize = 20000
opts.nend=10

mm.train

And I get following error:

scala.MatchError: 959330605 (of class java.lang.Integer)
at BIDMat.HMat$.loadMat(HMat.scala:304)
at BIDMat.HMat$.loadMat(HMat.scala:323)
at BIDMach.datasources.FileSource$Prefetcher$$anonfun$run$1.apply$mcVI$sp(FileSource.scala:248)
at scala.collection.immutable.Range.foreach$mVc$sp(Range.scala:160)
at BIDMach.datasources.FileSource$Prefetcher.run(FileSource.scala:238)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)

scala.MatchError: 959330605 (of class java.lang.Integer)
at BIDMat.HMat$.loadMat(HMat.scala:304)
at BIDMat.HMat$.loadMat(HMat.scala:321)
at BIDMach.datasources.FileSource$$anonfun$init$1.apply$mcVI$sp(FileSource.scala:128)
at scala.collection.immutable.Range.foreach$mVc$sp(Range.scala:160)
at BIDMach.datasources.FileSource.init(FileSource.scala:127)
at BIDMach.Learner.init(Learner.scala:56)
at BIDMach.Learner.firstPass(Learner.scala:93)
at BIDMach.Learner.retrain(Learner.scala:82)
at BIDMach.Learner.train(Learner.scala:71)
... 33 elided

Even if I change the extension of file to .txt, I still have this error.
I use scala interpreter using ./bidmach

Mat.checkCUDA:
2 CUDA devices found, CUDA version 8.0

nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Sun_Sep__4_22:14:01_CDT_2016
Cuda compilation tools, release 8.0, V8.0.44

I have 2 Tesla K80.

If I load data from MNIST8M folder, I can use clustering with this data successfully.

But I'd like to get the power of BidMach to cluster my own datasets. How can I use it in BidMach?

Thanks in advance!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Loading data from .csv file #135

Loading data from .csv file #135

GearFear commented Nov 17, 2016

Loading data from .csv file #135

Loading data from .csv file #135

Comments

GearFear commented Nov 17, 2016